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预备 知识 篇 

C 魔 法 概览 

例 说 编程 语言 

用 C 语 言 编程 的 基本 注意 事项 
主流 C 语 言 编 译 器 介绍 

关于 GNU 规 范 的 语法 扩展 

用 C 语 言 构建 一 个 可 执行 程序 的 流程 
本 章 小 结 

学 习 C 语 言 的 预备 知识 
计算 机 体系 结构 简介 
整数 在 计算 机 中 的 表示 

浮 点 数 在 计算 机 中 的 表示 
地 址 与 字 节 对 齐 

字符 编码 

大 端 与 小 端 

按 位 逻辑 运算 

移 位 操作 
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C 语 言 编程 的 环境 搭建 
Windows 操 作 系统 下 搭建 C 语 言 编程 环境 
macOS 系 统 下 搭建 C 语 言 编 程 环境 
本 章 小 结 
基础 语法 篇 

C 语 言 中 的 基本 元 素 

C 语 言 中 的 字符 集 

C 语 言 中 的 token 

关于 C 语 言 中 的 “对 象 ” 

C 语 言 中 的 “副作用 >” 

C 语 言 标 准 库 中 的 printf 函 数 
本 章 小 结 





基本 数据 类 型 

整数 类 型 

数据 精度 与 类 型 转换 
C 语 言 基本 运算 操作 符 

sizeof 操 作 符 

投射 操作 符 

本 章 小 结 

用 户 自 定 义 类 型 


6.1 枚 举 类 型 

6.2 ”结构 体 类 型 

6.3 ”联合 体 类 型 

6.4 位 域 

6.5” 字 节 对 齐 与 字 节 填充 
6.6 ”复数 类 型 


6.7 ”本章 小 结 








第 7 半 C 语 言 的 数组 与 指针 


7.1 一 维 数组 

7.2 ”多维 数组 

7.3” 变 长 数组 

7.4 一 级 指针 与 对 象 地址 

7.5 多 级 指针 

7.6 ”指向 用 户 自 定 义 类 型 的 指针 
7.7 指针 与 数组 的 关系 

7.8 指向 数组 的 指针 

7.9 void 类型、 指向 void 类 型 的 指针 与 空 指针 
7.10 字符 数组 与 字符 串 字面 量 
7.11 完整 与 不 完整 类 型 

7.12 ”灵活 的 数组 成 员 

7.13 本章 小 结 


第 8 章 
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9.3 
9.4 
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9.8 
9.9 
9.10 
9.11 


C 语 言 的 控制 流 语句 
逗号 表达 式 
条 件 表达 式 

if-else 语 名 
switch-case 语 句 
while 与 do-while 迭 代 语 名 
for 迭 代 语 句 

goto 语 名 

本 章 小 结 

C 语 言 的 函数 
函数 的 声明 与 定义 
函数 调用 与 实现 

数组 类 型 作为 函数 形 参 
带 有 不 定 参数 类 型 及 个 数 的 函数 声明 与 调用 
函数 的 递归 调用 


内 联 函 数 

函数 的 返回 类 型 与 无 返回 函数 
指向 函数 的 指针 

C 语 言 中 的 主 函 数 main 

函数 与 函数 调用 作为 sizeof 操 作 符 
本 章 小 结 


第 10 章 ”C 语 言 预 处 理 器 
jl 
10.2 C 语 言 中 预定 义 的 宏 
10.3 条件 预 编译 
10.4 ” 源 文件 包含 预 处 理 指示 符 
10.5 ”#error 预 处 理 指示 符 
10.6 ”要 ine 预 处 理 指示 符 
10.7 ”#undef 预 处 理 指示 符 
10.8 ”pragma 预 编译 指示 符 与 操作 符 
10.9 空 指示 符 与 C 语 言 中 的 程序 注释 
10.10 本章 小 结 

第 11 章 ”C 语 言 程序 的 编译 上 下 文 
11.1 C 语 言 程序 中 的 作用 域 和 名 字 空 间 
11.2 全 局 对 象 与 函数 
11.3 ”静态 对 象 与 函数 
11.4 局 部 对 象 
11.5 对象 的 存储 与 生命 周期 
11.6 _Thread_local 对 象 
11.7 本 章 小 结 

第 三 篇 ”高 级 语法 篇 


第 12 章 ”Ci 语言 中 的 类 型 限定 符 








const 限 定 符 

volatile 限 定 符 
restrict 限 定 符 

_Atomic 限 定 符 

本 草 小 结 

C 语 言 的 类 型 系统 
对 象 类 型 与 函数 类 型 

对 声明 符 的 进一步 说 明 

更 复杂 的 声明 
typedef 类 型 定义 

本 章 小 结 

C11 标 准 中 的 表达 式 、 左 值 与 求 值 顺序 
常量 表达 式 

没 型 选择 表达 式 

静态 断言 

C 语 言 中 的 左 值 

C 语 言 中 表达 式 的 求 值 顺序 
C 语 言 中 的 语句 

本 章 小 结 


函数 调用 约定 与 ABI 





Windows 操 作 系 统 环境 下 x86 处 理 器 的 函数 调用 约定 


15.2 ”Unix/Linux 操 作 系统 环境 下 x86 处 理 右 的 函数 调用 约定 
15.3 ”ARM 处理 器 环境 下 的 函数 调用 约定 
15.4 本 章 小 结 

第 16 章 ”创建 静态 库 与 动态 库 
16.1 Windows 系 统 下 创建 静态 库 与 动态 库 
16.2 macOS 系 统 下 创建 静态 库 与 动态 库 
16.3 Linux 系 统 下 创建 并 使 用 静态 库 与 动态 库 
16.4 本 章 小 结 

第 四 篇 ”语法 扩展 篇 

第 17 章 ”GCC 对 C11 标 准 的 语法 扩展 
17.1 在 表达 式 中 使 用 复合 语句 与 声明 
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17.8” 半 精度 浮 点 类 型 
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17.10 ”对 可 变 参数 个 数 的 宏 的 语法 扩展 
17.11 ” case 语句 中 使 用 范围 表达 式 
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对 C 语 言 的 未 来 展望 
C 语 言 中 的 属性 
fallthrough 属 性 

数组 片段 

其 他 语法 特性 
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第 五 篇 ”项目 实践 篇 


第 20 章 
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20.2 
20.3 


制作 UTF-8 与 UTF-16 编 码 字 符 串 的 转 码 器 
UTF-8 字 符 编码 格式 
UTF-16 字 符 编码 格式 

代码 示例 
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21.4 


本 章 小 结 

制作 控制 台 计 算 器 

对 数字 的 解析 

对 操作 符 的 优先 级 处 理 
代码 示例 


本 章 小 结 


为 什么 要 与 这 本 市 


本 人 在 2001 年 上 了 大 学 本 科 ， 读 计算 机 科学 与 技术 专业 。 在 第 一 年 
的 上 半 学 期 ， 对 计算 机 编程 还 没什么 感觉 。 但 是 就 在 考 “C 语 言 程序 设 
十 ”这 门 专业 课 的 前 一 个 月 ， 感 觉 这 门 课 学 了 那么 久 几 乎 什么 都 不 会 ， 
可 把 我 急 坏 了 。 然 后 就 在 这 短 短 一 个 月 的 时 间 里 又 是 看 书 ， 又 是 上 机 实 
验 ， 终 于 考 了 70 多 分 ， 算 是 过 关 了 .……. 不 过 奇怪 的 是 在 考试 结束 后 ， 就 
发 现 自己 对 编程 有 了 感情 。 到 了 大 二 ， 我们 上 “数据 结构 ”所 使 用 的 教材 
是 基于 C++ 编程 语言 的 ， 因 为 之 前 没 学 过 C++ 语言 ， 所 以 只 能 自学 。 而 
在 这 个 过 程 中 ， 我 发 现 自 己 对 编程 更 加 热爱 。 在 上 完 大 三 之 后 ， 我 在 暑 
假 里 又 把 之 前 的 C 语 言 重 新 巩固 一 番 。 有 了 计算 机 组 成 、 操 作 系 统 、 汇 

编 语言 、 数 据 结构 等 知识 积淀 之 后 再 去 看 C 语 言 编 程 就 感觉 容易 多 了 。 
我 也 是 由 此 喜欢 上 了 C 编 程 语言 。 























10 年 之 后 ， 发 现 国内 市 面 上 很 多 C 语 言 参考 书 仍然 显得 非常 陈旧 。 
不 仅 基 于 古老 的 C89/90 标 准 ， 而 且 还 在 用 Visual C++6.0 这 种 既 收 费 又 老 
上 日 的 开发 环境 教学 生 。 对 于 比较 新 的 C99 标 准 的 讲解 屈指 可 数 ， 更 鲜 有 
针对 最 新 的 C11 标 准 的 书籍 。 出 于 对 C 语 言 的 热爱 ， 在 此 热切 希望 能 把 


最 新 标准 的 C 语 言 奉献 给 各 位 读者 ， 也 想 把 C 语 言 的 方方面面 讲 透 并 且 
能 讲 得 通俗 易 懂 ， 方 便 读 者 去 思考 实践 ， 所 以 这 也 是 我 写 这 本 书 的 主要 
原因 。 当 各 位 阅读 完 本 书 之 后 ， 会 发 现 C 语 言 竟 然 如 此 强大 ! 而 且 在 大 
部 分 时 候 ， 尤 其 是 我 们 想 集中 注意 力 解 决 某 个 特定 问题 的 时 候 ， 使 用 C 








语言 要 比 用 其 他 一 些 基于 面向 对 象 的 类 C 编 程 语言 (比如 C++、Java 
等 ) 要 直观 得 多 ! 


本 书 之 所 以 叫 “C 语 言 编 程 魔法 书 ”， 是 因为 像 * 宝 典 ”“ 和 圣经 ?之 类 
的 词 已 经 被 用 滥 了 。 再 者 ，C 语 言 本 里 就 拥有 极其 强大 的 魔力 ， 你 能 
它 做 几乎 所 有 的 事情 。 而 且 几 乎 每 一 个 C 语 言 编译 器 都 能 内 联 汇 编 语 
言 ， 或 者 与 Ct++、Objective-C 和 直接 兼容 ， 而 对 于 像 Java、C#、Python 等 
许多 编程 语言 也 有 相应 的 接口 。 所 以 ， 我 认为 C 语 言 在 计算 机 编程 语言 
领域 中 就 好 比 数 学 在 自然 科学 中 的 地 位 和 作用 ， 它 是 很 多 编程 语言 的 基 
础 ， 而 且 很 多 编程 语言 的 编译 嚣 或 解释 器 也 都 是 基于 C 语 言 来 写 的 。 




















就 在 2015 年 2 月 ，Khronos 标 准 组 织 发 布 了 最 具 现 代 化 的 图 形 API 
Vulkan， 其 主机 端 接口 用 的 API 是 纯 C 语 言 。 此 外 ， 像 OpenGL、 





OpenCL、OpenAL、OpenVG 等 开放 标准 都 基于 纯 C 语 言 。 此 外 ， 最 近 
10 年 来 TIOBE 每 月 的 编程 语言 排名 ，C 语 言 排名 始终 能 进 前 两 名 ， 也 能 
说 明 它 的 使 用 范围 之 广 ， 而 且 许 多 开源 项 目 也 多 多 少 少 会 使 用 C 语 言 来 
编号 。 况 且 学 了 C 语 言 之 后 ， 再 学 习 C++、Java 等 面向 对 象 编 程 语言 也 
会 轻松 很 多 。 尤 其 像 C++ 和 Objective-<C， 没 有 C 语 言 基 础 是 完全 不 行 














的 。 所 以 个 人 十 分 推荐 计算 机 系 的 大 学 生 将 C 语 言 作 为 自己 的 计算 机 入 


门 编程 语言 ! 


本 书 特色 


从 技术 层面 上 讲 ， 本 书 介绍 了 C 语 言 的 最 新 标准 ， 即 ISO/IEC 
9899: 2011。 同 时 ， 也 介绍 了 主流 开源 C 语 言 编译 器 GCC 与 Clang 对 标准 
C 语 言语 法 的 扩充 。 而 且 所 基于 的 编译 器 和 开发 环境 也 是 比较 新 的 
Visual Studio Community 2017、GCC 5， 以 及 Clang 3.8 (Apple LLVM 
8.0， 基 于 Xcode 8) 。 








从 适合 读者 阅读 和 掌握 知识 的 结构 安排 上 讲 ， 本 书 分 为 “预备 知识 
篇 “基础 语法 篇 "、“ 高 级 语法 篇 "， 以 及 “语法 扩展 篇 "， 还 有 最 后 
的 “项 目 实 践 篇 "。 从 基础 到 高 级 ， 循 序 渐进 地 为 读者 描述 C 语 言 编 程 方 
法 。 本 书 尤其 着 重 C 语 言 标准 语法 上 的 精确 描述 ， 通 过 许多 代码 片段 给 
读者 介绍 各 种 C 语 言语 法 知识 ， 并 且 能 反映 出 C 语 言 的 灵活 性 以 及 在 使 
用 上 的 约束 。 


本 书 推 党 读 者 使 用 合法 免费 的 C 语 言 编 译 器 以 及 集成 开发 环境 ， 希 
望 读 者 能 有 正确 的 软件 版 权 意 识 ， 这 样 才能 更 好 地 为 我 国 软件 事业 增添 
光彩 ， 为 打造 良好 的 应 用 市 场 以 及 生态 环境 作出 贡献 。 因 此 ， 本 书 主要 
选择 使 用 GCC、Clang 这 两 个 主流 开源 免费 的 C 语 言 编 译 器 ， 而 集成 开发 


环境 (IDE) 则 采用 Visual Studio Community、Eclipse、Xcode 这 三 个 党 
用 的 免费 开发 工具 ， 其 中 ，Visual Studio Community 不 是 开源 的 ， 而 
Xcode 则 是 部 分 开源 的 。 


本 书 虽然 会 讲解 整个 C 编 程 语言 ， 涉 及 了 几乎 所 有 的 语法 点 ， 但 是 
考虑 到 本 书 读者 可 能 是 初学 C 语 言 ， 且 没有 多 少 计算 机 专业 知识 ， 所 以 
本 书 措辞 会 尽量 通俗 ， 而 不 过 于 追求 学 术 化 。 某 些 描述 可 能 会 不 太 严 
说， 但 对 于 本 书 所 用 到 的 GCC、Clang 这 两 大 主流 编译 器 而 言 将 完全 适 
用 。 另 外 ， 考 虑 到 不 少 读者 从 事 舱 入 式 系统 开发 工作 ， 所 以 对 于 C 语 言 
标准 中 出 现 的 所 谓 “ 由 实现 定义 的 ?场合 会 尽量 区 分 情况 分 别 曾 明 。 本 书 
的 最 终 的 目的 就 是 让 读者 至 少 能 熟练 掌握 C 语 言 编 程 ， 能 将 它 灵 活 地 运 
用 于 实际 工程 中 。 











读者 对 象 


-乱入 式 系统 开发 者 
移动 或 桌面 客户 端 应 用 程序 开发 者 
服务 顺 端 应 用 程序 开 肥 者 


系统 染 构 师 


计算 机 、 电 子 工程 、 通 信 专 业 的 大 学 生 





其 他 对 C 语 言 编 程 感 兴趣 的 人 
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如 何 阅读 本 书 


本 书 一 共 分 为 四 大 篇 。 


预备 知识 篇 〈 第 1 一 3 章 ) ， 简 单 描述 C 语 言 的 概况 、 学 习 C 语 言 的 
预备 知识 ， 以 及 在 Windows、macOS 和 Linux 三 大 桌面 环境 下 搭建 编写 C 
环境 的 方法 。 


第 1 章 ”CC 魔法 概览 。 主 要 介绍 C 语 言 的 来 历 和 演化 ， 用 它 编写 代码 
的 编程 模式 以 及 我 们 可 以 用 于 实践 的 主流 C 语 言 编译 器 。 











第 2 章 ”学 习 C 语 言 的 预备 知识 。 这 一 章 主要 为 不 太 熟 悉 计 算 机 系统 
的 读者 提供 一 些 基础 的 计算 机 理论 知识 和 相关 概念 ， 比 如 整数 与 浮 点 数 
在 计算 机 中 的 表示 方法 、 字 符 编码 格式 、 按 位 逻辑 计算 、 移 位 操作 等 。 





第 3 章 ”C 语 言 编 程 的 环境 搭建 。 这 一 章 主 要 介绍 了 Windows、 
macOS 以 及 Linux 系 统 下 如 何 安装 并 使 用 主流 编译 器 与 集成 开发 环境 。 
基础 语法 篇 〈 第 4~11 章 ) 讲解 C 语 言 的 基本 语法 。 这 是 C 语 言 程序 


员 必 须 掌握 的 。 





第 4 章 ”CC 语言 中 的 基本 元 素 
及 合法 token 的 构成 。 此 外 还 介绍 了 标识 4 
用 说 明 。 


一 曹 描述 





Ar 


了 C 语 言 中 党 用 字 
符 、 





第 5 草 ” 基 本 数据 类 型 。 
类 型 数据 的 表示 ， 


符 集 以 
关键 字 以 及 标点 符号 的 使 
本 数据 类 





类 型 、 字 符 > 
以 及 它们 之 间 的 类 型 转换 。 此 外 还 描述 
4 的 算术 逻辑 操作 、 投 射 操作 以 及 通过 sizeof 操 作 各 
类 型 与 对 象 相 应 的 字 节 数 


草 


型 、 浮 后 
了 对 于 这 些 基 
守 获取 数据 
第 6 章 ”用 户 自 定 义 类 型 。 这 一 章 描 i 
这 三 种 用 户 昌 定义 类 型 ， 并 介 
第 7 章 


述 了 枚 举 、 结 构 体 以 及 联合 体 
了 它们 的 特性 以 及 各 种 使 用 方式 
CH 号 的 数组 和 于 针 





一 章 十 分 关键 ， 也 是 C 语 言 的 语法 
难点 。 这 里 详细 介绍 了 C 语 言 中 一 维 数组 与 多 维 数组 的 表示 以 及 如 何 对 
它们 进行 操作 ， 然 后 介绍 了 C 语 言 中 的 指针 类 型 ， 
的 使 用 技巧 以 及 需要 注意 的 事项 


详细 前 述 了 指针 类 型 
第 8 章 ”C 语 言 的 控制 流 语句 。 这 介绍 了 Ci 
择 语句 以 及 循环 等 控制 流 语句 

第 9 章 ”CC 语言 的 水 数 。 记 





语言 的 条 件 语句 、 选 
章 介 绍 了 C 语 言 中 的 函数 想 

语言 函数 的 声明 及 定义 ， 还 有 C 函 数 的 调用 。 此 外 

标识 符 作 为 表达 式 时 的 类 型 


， 包 括 C 


寿 言 函 


绍 了 C 语 言 函 数 


第 10 章 ”C 语 言 的 预 处 理 器 。 这 章 包 含 了 目前 C11 标 准 中 所 支持 的 
所 有 预 处 理 器 特性 ， 包 括 宏 定义 、 预 处 理 条 件 、 预 编译 指示 符 与 操作 符 
以 及 C 代 码 的 注释 。 





第 11 革 C 语 言 的 编译 上 下 文 。 这 一 章 介绍 了 C 语 言 对 象 与 函数 的 
作用 域 和 名 字 空 间 。 详 细 介 绍 了 C 语 言 中 的 四 大 作用 域 以 及 在 不 同 作 用 
域 中 的 对 象 的 生命 周期 。 此 外 还 介绍 了 对 象 与 函数 的 连接 属性 ， 包 括 外 
部 连接 和 内 部 连接 。 


高 级 语法 篇 《第 12 一 16 章 ) 讲述 C 语 言 的 一 些 高 级 特性 。 这 一 部 分 


内 容 不 需要 C 语 言 程序 员 必须 和 掌握， 但 需要 对 此 有 个 大 构 了 解 。 











第 12 章 ”C 语 言 中 的 类 型 限定 符 。 该 章 介 绍 了 C11 标 准 中 支持 的 
const、volatile、restrict 与 _Atomic 这 四 种 限定 符 。 详 细 说 明了 限定 符 用 
于 修饰 含有 指针 的 对 象 时 ， 在 * 号 的 不 同位 置 所 起 到 的 不 同 作用 。 然 后 


分 别 介绍 这 四 种 限定 符 的 具体 含义 。 


第 13 章 ”C 语 言 中 的 类 型 系统 。 这 一 章 把 C 语 言语 法 体系 中 的 整个 
类 型 系统 再 梳理 了 一 遍 。 这 一 章 介绍 了 对 于 一 些 复杂 类 型 的 对 象 如 何 去 
剖析 、 理 解 ， 然 后 自己 如 何 去 声 明 自 己 想 要 的 复杂 类 型 的 对 象 和 函数 。 
这 一 章 所 描述 的 其 实 是 整个 C 语 言语 法 体系 的 核心 ， 如 果 大 家 能 掌握 的 
话 ， 那 么 基本 残 算 是 真正 掌握 C 语 言 了 。 其 实 ， 对 于 任 一 强 类 型 的 编程 
语言 而 言 ， 其 系统 类 型 总 是 扮演 着 十 分 重要 的 角色 ， 我 们 学 习 此 类 语言 











都 需要 透彻 理解 其 整个 类 型 系统 。 











第 14 章 ”CI11 标 准 中 的 表达 式 、 左 值 与 求 值 顺序 。 该 章 先 介绍 了 
C11 标 准 中 各 类 表达 式 以 及 它们 的 计算 优先 级 。 然 后 介绍 了 “ 左 值 ” 这 个 
概念 ， 并 讲解 了 表达 式 之 间 的 求 值 顺序 。 








第 15 章 ”函数 调用 约定 与 ABI。 该 章 与 C 语 言 标 准 并 无 太 大 关系 ， 
但 却 与 实际 项 目 开 发 有 关 。 这 一 章 介 绍 了 主流 C 语 言 编 译 器 所 采用 的 函 
数 调用 约定 ， 然 后 详细 描述 了 函数 调用 的 过 程 ， 包 括 参数 传递 和 返回 值 
的 具体 处 理 。 该 章 对 藤 入 式 系 统 开 发 者 以 及 需要 将 C 语 言 与 汇编 语言 进 
行 交 互 使 用 的 高 性 能 计算 开发 者 而 言 ， 将 大 为 有 用 。 














第 16 章 “创建 动态 库 与 静态 库 。 这 一 章 介绍 了 用 主流 C 语 言 编译 工 
具 构 建 静态 库 以 及 动态 库 的 方法 ， 并 介 


语法 扩展 篇 〈 第 17 一 19 章 ) 讲述 了 GCC 与 Clang 编 译 器 对 C 语 言 的 扩 
展 。 


第 17 章 ”GCC 对 C11 标 准 的 扩展 。 该 章 先 简单 介绍 GNU 语 法 扩展 ， 
然后 介绍 GCC 编译 器 中 常用 的 扩展 语法 。 


第 18 章 “Clang 编 译 器 对 C11 标 准 的 扩展 。 该 章 介绍 了 Clang 编 译 器 
对 C11 标 准 的 语法 扩展 。 最 后 还 介绍 了 Apple 开 源 的 Grand Central 
Dispatch 库 的 简单 使 用 。 





第 19 章 ”对 C 语 言 的 未 来 展望 。 该 章 主要 介绍 了 C 语 言 的 设计 理念 
以 及 当前 C 语 言 标准 委员 会 的 工作 组 正在 为 C 语 言 新 增 的 内 容 ， 还 谈 到 
了 哪些 特性 不 会 被 添加 到 C 语 言 中 去 。 





项 目 实践 篇 〈 第 20 一 21 章 ) ， 这 里 通过 两 个 实际 的 C 语 言 项 目 来 介 
绍 我 们 如 何 利 用 C 语 言 来 创作 出 自己 的 程序 。 


第 20 划 ”描述 了 UTF-8 编 码 格式 的 字符 串 与 UTF-16 编 码 格式 的 字符 
串 进行 相互 转换 的 例子 。 








第 21 半 ”介绍 一 个 看 似 简单 而 功能 很 丰富 的 基于 控制 台 的 计算 器 程 
序 。 


建议 零 基础 的 读者 要 了 解 第 一 篇 的 预备 知识 ， 这 对 于 后 面 深入 学 习 
C 语 言 编 程 很 有 帮助 。 另 外 ， 这 部 分 读者 可 以 先 不 用 强行 看 第 三 篇 ， 尤 
其 是 第 15 章 。 因 为 第 三 篇 涉及 的 知识 比较 深 ， 而 第 15 章 又 会 直接 引入 汇 
编 语言 ， 这 对 于 没有 一 定 计算 机 专业 知识 的 读者 会 比较 难以 理解 。 如 果 
是 有 一 定 计算 机 专业 知识 的 读者 可 以 略 过 第 一 篇 ， 直 接 阅读 第 二 篇 。 另 
外 ， 如 果 是 从 事 符 入 式 系统 开发 的 、 或 从 事 系统 底层 开发 的 资深 程序 
员 ， 建 议 仔细 阅读 第 三 、 第 四 篇 ， 相 信 这 部 分 内 容 会 对 你 的 工作 很 有 帮 
助 。 


























惑 误 和 文 持 


由 于 笔者 的 水 平 有 限 ， 编 写 时 间 仓 促 ， 书 中 难免 会 出 现 一 些 错误 或 
者 不 准确 的 地 方 ， 奶 请 读者 批评 指正 。 如 果 你 有 更 多 的 宝贵 意见 ， 欢 迎 
你 访问 我 的 个 人 博客 网 站 http://blog.csdn.net/zenny_chen 进 行 专题 讨论 ， 
我 会 尽量 在 线 上 为 你 提供 最 满意 的 解答 。 同 时 ， 你 也 可 以 通过 微 
博 http://weibo.com/zennylchen 与 我 联系 ， 或 发 送 电 子 邮 件 到 
zenny_chen@163.com。 期 待 能 够 得 到 你 们 的 真挚 有 反馈， 在 技术 之 路 上 互 
锡 共 进 。 另 外 ， 本 书 最 后 两 章 的 代码 可 以 在 作者 的 GitHub 上 获 
取 : https://github.com/zenny-chen。 
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首先 感 谢 我 的 父母 和 麦子 对 我 写作 此 书 的 大 力 文 持 ， 尤 其 是 我 妻子 
在 我 忙于 工作 、 编 写 此 书 时 帮忙 照顾 孩子 和 做 饭 。 然 后 感谢 我 公司 老板 
对 我 写作 此 书 的 豆 舞 与 期 待 。 
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时 间 里 给 予 我 的 大 力 文 持 和 玫 助 。 


最 后 感谢 文 持 我 的 扩 术 爱好 者 ， 感 谢 你 们 对 我 的 文 持 以 及 对 我 的 信 
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我 想 和 作者 聊 聊 


为 了 能 更 好 地 与 读者 进行 联系 ， 笔 者 这 里 留 了 一 个 QQ 讨论 群 。 各 
位 如 果 在 阅读 此 书 中 有 任何 疑问 可 以 来 本 群 询问 ， 大 家 可 以 一 起 探讨 。 
各 位 可 以 扫 一 扫 下 方 的 二 维 码 ， 进 此 群 的 提示 语 为 :“C 语 言 编 程 魔法 
书 ”， 或 者 查询 群 号 86540289 申 请 入 和 群 。 








口 BR 人 


I 
Ep 






zenny_chen 作 者 读书 群 
扫 一 扫 二 维 码 ， 加 入 该 群 。 


陈 轶 


第 一 访 ”预备 知识 篇 






整数 在 计算 机 中 的 二 进 制 表示 
浮 点 数 在 计算 机 中 的 二 进 制 表示 


迎 辑 计算 与 移 位 操作 预备 知识 


有 Windows 系 统 下 的 环境 搭建 #3 








Linux 系 统 下 的 环境 搭建 





macOS 系 统 下 的 环境 搭建 


第 1 章 ”C 魔 法 概览 








本 章 内 容 主要 对 C 编 程 语言 《以 下 简称 C 语 言 ) 进行 大 体 介绍 ， 包 
括 它 的 历史 以 及 C 语 言 标准 的 演化 进程 。 然 后 介绍 一 下 C 语 言 编 程 思 
想 ， 当 前 主流 C 语 言 编译 器 以 及 GNU 语 法 扩展 。 最 后 简单 介绍 一 下 从 用 
C 语 言 编 写 程序 到 编译 、 构 建 一 个 可 执行 程序 的 大 致 过 程 。 











计算 机 编程 语言 从 对 计算 机 硬件 后 层 的 抽象 程度 进行 分 类 ， 可 分 
为 : 机 器 语言 、 汇 编 语言 以 及 高 级 语言 。 下 面 由 底层 到 高 层 分别 介 绍 这 
几 种 类 别 的 编程 语言 。 





1.1 例 说 编程 语言 


1) 机 器 语言 是 直接 通过 十 六 进 制 数 表 示 当 前 处 理 器 架构 的 机 器 指 
令 码 。 指 令 码 包含 了 当前 指令 的 功能 (比如 算术 逻辑 运算 、 移 位 、 分 
支 、 中 断 、IO 等 ) 、 寄 存 器 、 立 即 数 等 多 种 元 素 。 每 种 处 理 器 架构 所 
对 应 的 机 器 码 的 字 节 长 度 也 各 不 相同 ， 有 些 是 固定 长 度 的 《比如 
ARM、MIPS 等 架构 ) ， 有 些 是 可 变 长 度 的 〈 比 如 x86 架 构 ) 。 

















2) 汇编 语言 (Assembly Language) 通过 简单 的 指令 助 记 符 
(memonics) 来 表示 对 应 机 器 指令 的 功能 、 寄 存 器 编写 、 江 即 数 
(immediates) 等 元 素 。 汇 编 语 言 是 对 机 器 指令 的 简单 抽象 ， 通 过 汇编 

器 〈assembler) 可 以 将 汇编 语句 翻译 成 对 应 的 机 器 指令 码 。 





3) 局 级 语言 的 表达 形式 更 为 抽象 且 贴 近 我 们 日 党 的 语言 表述 。 而 
且 ， 高 级 语言 比 起 汇编 语言 往往 更 具有 表达 力 ， 且 拥有 更 加 丰富 的 语法 
特性 ， 以 便 将 程序 进行 结构 化 和 模块 化 。 比 如 ， 高 级 语言 具有 目 定 义 变 
量 标识 符 、 目 定义 数据 结构 、 分 文 与 循环 、 更 形象 目 然 的 表达 式 等 。 高 
级 语言 一 般 通 过 编译 器 〈compiler) 可 直接 将 表达 式 翻译 为 对 应 的 机 器 
指令 码 ;， 也 可 以 将 高 级 语言 先 翻译 为 中 间 语 言 ( 类 似 于 汇编 ， 但 可 能 比 
汇编 适用 范围 更 广 、 更 利于 路 平台 的 字 节 码 ) ， 最 后 将 中 间 语 言 翻 译 为 
最 终 的 机 融 指 令 码 。 

















当然 ， 有 些 书 中 还 介绍 了 第 四 代 语 言 ， 它 基于 高 级 语言 ， 比 高 级 语 
言 更 抽象 ， 只 需要 一 些 简单 的 描述 语句 就 能 让 计算 机 做 比较 复杂 的 工 
作 。 比 如 SQL《〈 结 构 化 得 询 语言 ， 用 于 数据 库 得 询 ) 算是 一 种 第 四 代 语 


百 。 


下 面 ， 为 了 能 让 大 家 对 这 三 种 层次 的 编程 语言 有 一 个 感性 的 认识 ， 
这 里 将 列举 ARMv8 架 构 处 理 颖 下 的 机 絮语 言 、 汇 编 语言 ， 加 上 它们 相 
应 的 C 语 言 。 读 者 如 果 手 头 有 Xcode， 并 且 有 包含 Apple A7 或 更 高 版 本 处 
理 吉 的 iOS 设 备 的 话 ， 可 以 直接 编译 运行 ， 并 能 看 到 最 终 效果 。 











下 面 首先 列 出 一 个 文件 名 为 my_sub.s 的 汇编 源 文 件 ， 其 中 包含 了 机 
俐 语言 和 汇编 语言 。 见 代码 清单 1-1: 











代码 清单 1-1 机 器 语言 与 汇编 语 襄 








.text 
.align 4 


#ifdef arm64 


.globl _my_sub_machine 
.globl _my_sub_assembly 





// 用 机 器 语言 实现 减法 操作 
_my_sub_machine: 














.long 0x4b010000 


.long Oxd65f03c0 











// 用 汇编 语言 实现 减法 操作 
_my_sub_assembly: 

















sub wO, wO, wi 
ret 


#endif 


一 4 


在 代码 清单 1-1 中 ，_my_sub_machine 程 序 片 段 中 的 两 条 .long 语 句 即 
为 机 器 指令 。 这 两 条 机 器 指令 正好 与 _ my_sub_assembly 中 的 两 条 汇编 指 
令 相 对 应 。 也 就 是 说 ，“0x4b010000? 这 串 32 位 的 十 六 进 制 代码 意思 就 
是 “sub w0，w0，w1”， 表 示 将 寄存 器 w0 与 寄存 器 w1 的 值 进行 相 减 ， 然 
后 将 结果 写 回 w0 寄 存 器 中 。 而 “0xd65f03c0” 指 令 码 对 应 于 “ret”( 更 确切 
地 说 是 ret x30) ， 表 示 返 回 当前 过 程 (procedure〉。 在 汇编 语言 中 ， 一 
般 会 使 用 过 程 或 者 例 程 〈routine) 来 表示 一 个 可 执行 的 程序 片段 。 在 C 
语言 中 一 般 都 用 函数 〈function) 表示 。 我 们 在 这 里 能 够 明显 看 到 ， 汇 
编 语 言 采用 指令 助 记 符 的 方式 比 写 机 器 指令 码 要 直观 得 多 ， 而 且 也 不 容 
易 出 错 。“sub” 指 令 的 功能 从 助 记 符 上 就 能 知道 是 "减法 ?功能 ， 而 w0、 
wl 也 明确 指明 了 使 用 的 寄存 器 是 w0 和 wl1。 这 些 在 “0x4b010000” 这 种 机 
器 指令 人 码 上 都 无 法 直观 地 表现 出 来 。 











代码 清单 1-2 列 出 C 语 言 是 如 何 表达 一 个 减法 操作 的 。 


代码 清单 1-2 减法 操作 对 应 的 C 语 言 





static int my_sub_c(int a, int b) 


return a - b; 





代码 清单 1-2 所 列 出 的 C 语 言 代 码 与 代码 清单 1-1 中 的 机 器 指令 码 和 
汇编 语言 完全 对 应 ， 意 思 一 目 了 然 一 一 将 参数 变量 a 的 值 与 参数 变量 b 的 
值 进行 相 减 ， 然 后 将 结果 返回 。 从 这 里 我 们 就 能 看 到 机 器 语言、 汇编 语 














言 以 及 以 C 语 言 为 代表 的 高 级 语言 之 间 在 表达 力 上 的 差距 了 。 高 级 语言 
的 目的 就 是 为 了 给 程序 员 提 供 更 恨 好 的 编程 工具 ， 更 简洁 、 更 富有 表达 
力 的 语言 ， 使 得 我 们 程序 员 能 提升 生产 力 ， 并 且 能 构思 出 更 多 精彩 炫 酷 
的 应 用 ， 而 不 是 把 太 多 的 精力 都 投入 在 如 何 让 计算 机 执行 的 细节 上 。 








代码 清单 1-3 能 让 我 们 在 主 函 数 或 其 他 函数 中 测试 上 述 已 经 编写 好 
的 函数 。 


代码 清单 1-3 ”展示 减法 操作 的 结 





#ifdef arm64 


extern int my_sub_machine(int a, int b); 
extern int my_sub_assembly(int a, int b); 


int result_machine = my_sub_machine(10, 2); 

int result_assembly = my_sub_assembly(5, 3); 

int result c = my_sub_c(6, 2); 

printf("Three results: %d, %d, %d\n", result_ machine, result assembly, result_c); 


#endif 





执行 了 上 述 代码 之 后 ， 我 们 最 后 能 在 控制 台 看 到 输出 结果 : “Three 
results: 8，2，4”。 可 见 ， 上 述 三 种 不 同 的 编程 语言 ， 计 算 功 能 是 完 
一 致 的 ， 都 是 对 两 个 输入 参数 做 减法 操作 ， 然 后 返回 差 值 。 然 而 就 可 读 
性 、 可 理解 性 以 及 编程 便利 性 而 言 ， 显 然 C 语 言 比 起 其 他 两 者 要 强 得 
多 。 而 可 读 性 最 差 的 无 疑 就 是 机 器 指令 码 了 。 





1.C 语 言 的 类 别 与 产生 





对 于 高 级 语言 来 说 ， 从 表达 上 又 可 分 为 命令 式 编程 语言 
(imperative programming language) 和 陈述 型 编程 语言 〈declarative 
programming language) 。 命 令 式 语言 主要 包括 过 程式 (procedural) 、 
结构 化 (structured〉 以 及 面 癌 对 象 (objectroriented) 的 编程 语言 ， 陈述 
型 编程 语言 主要 包括 函数 式 〈functional) 以 及 逻辑 型 〈logical ) 编程 语 
言 。 而 C 语 言 则 属于 结构 化 的 命令 式 编程 语言 。 不 过 现在 很 多 命令 式 编 
程 语言 也 包含 了 一 些 函 数 式 编程 语言 的 特征 。 在 本 书 中 ， 后 面 第 18 章 中 
谈 到 的 Blocks 语 法 就 是 一 个 很 典型 的 函数 式 编程 语言 的 语法 。 











C 语 言 最 初 由 Dennis Ritchie 于 1969 年 到 1973 年 在 AT&T 贝 尔 实 验 室 
里 开发 出 来 ， 主 要 用 于 重新 实现 Unix 操 作 系 统 。 此 时 ，C 语 言 又 被 称 为 
K&R C。 其 中 ，K 表 示 Kernighan 的 首 字 母 ， 而 R 则 是 Ritchie 的 首 字 母 。 
K&R C 语 言 与 后 来 标准 化 的 C 语 言 有 很 大 差异 。 比 如 ， 如 果 函 数 返回 类 
型 为 int， 则 int 可 省 : int my_function() {}， 也 可 以 写成 
my_function〈) {}。 编 译 器 不 会 有 任何 警告 ， 更 不 会 报错 。 另 外 ， 还 有 
现在 看 来 比较 奇 划 的 函数 定义 ， 像 我 们 现在 定义 这 么 一 个 函数 
my_function (int a，char*p) {}， 如 果 是 用 K&R C 语 法 定义 的 话 要 写 














void 


成 : void my_function (a，p) int a; char*p; {}。K&R 的 C 语 法 中 ， 定 
义 一 个 函数 时 ， 其 形 参 列表 先 列 出 形 参 的 标识 符 ， 然 后 在 函数 声明 的 后 
面 紧 跟着 对 形 参 标识 符 的 完整 声明 ， 最 后 是 函数 体 。 这 在 现行 标准 中 已 
经 被 逐步 废弃 使 用 了 。 另 外 ， 当 时 的 第 一 本 C 语 言 专 业 书 《The C 

Programming Language》 也 并 非 一 个 正式 的 编程 语言 规范 ， 但 被 用 了 许 


多 年 。 
2.C90 标 准 


由 于 C 语 言 被 各 大 公司 所 使 用 (包括 当时 处 于 鼎盛 时 期 的 [BM 

) ， 因 此 到 了 1989 年 ，C 语 言 由 美国 国家 标准 协会 (ANSI) 进行 了 
标准 化 ， 此 时 C 语 言 又 被 称 为 ANSI C。 而 仅 过 一 年 ，ANSI C 就 被 国际 标 
准 化 组 织 ISO 给 采纳 了 。 此 时 ，C 语 言 在 ISO 中 有 了 一 个 官方 名 称 
ISO/IEC 9899: 1990。 其 中 ，9899 是 C 语 言 在 ISO 标 准 中 的 代号 ， 像 
C++ 在 ISO 标准 中 的 代号 是 14882。 而 冒号 后 面 的 1990 表 示 当 前 修订 好 的 
版 本 是 在 1990 年 发 布 的 。 对 于 ISO/IEC 9899: 1990 的 俗称 或 简称 ， 有 些 
地 方 称 为 C89， 有 些 地 方 称 为 C90， 或 者 C89/90。 不 管 怎么 称呼 ， 它 们 
都 指 代 这 个 最 初 的 C 语 言 国际 标准 。 这 个 版 本 的 C 语 言 标 准 作 为 K&R C 
的 一 个 超 集 ( 即 K&R C 是 此 标准 C 的 一 个 子 集 ) ， 把 后 来 引入 的 许多 非 
官方 特性 也 一 起 整合 了 进去 。 其 中 包括 了 从 C++ 借 鉴 的 函数 原型 
(Function Prototypes，〉， 指 辣 void 的 指针 ， 对 国际 字符 集 以 及 本 地 语言 
环境 的 支持 。 在 此 标准 中 ， 尽 管 已 经 将 函数 定义 的 方式 改 为 现在 我 们 常 
用 的 那 种 方式 ， 不 过 K&R 的 语法 形式 仍然 兼容 。 








3.C99 标 准 


在 随后 的 几 年 里 ，C 语 言 的 标准 化 委员 会 又 不 断 地 对 C 语 言 进行 改 
进 ， 到 了 1999 年 ， 正 式 发 布 了 ISO/IEC 9899: 1999， 人 简称 为 C99 标 准 。 


C99 标 准 引 入 了 许多 特性 ， 包 括 内 联 函 数 (inline functions) 、 可 变 长 度 
的 数组 、 灵 活 的 数组 成 员 《〈 用 于 结构 体 ) 、 复 合 字面 量 、 指 定 成 员 的 初 
始 化 器 、 对 IEEE754 浮 点 数 的 改进 、 文 持 不 定 参数 个 数 的 宏 定义 ， 在 数 
据 类 型 上 还 增加 了 long long int 以 及 复数 类 型 。 毫 不 夸张 地 说 ， 即 便 到 目 
前 为 止 ， 很 少 有 C 语 言 编译 器 是 完整 文 持 C99 的 。 像 主流 的 GCC 以 及 
Clang 编 译 器 都 能 支持 高 达 90% 以 上 ， 而 微软 的 Visual Studio 2015 中 的 C 
编译 器 只 能 文 持 到 70% 左 厂 。 


4.C11 标 准 


2007 年 ，C 语 言 标 准 委 员 会 又 重新 开始 修订 C 语 言 ， 到 了 2011 年 正 
式 发 布 了 ISO/IEC 9899: 2011， 简 称 为 C11 标 准 。C11 标 准 新 引入 的 特征 
尽管 没 C99 相 对 C90 引 入 的 那么 多 ， 但 是 这 些 也 都 十 分 有 用 ， 比 如 : 字 
节 对 齐 说 明 符 、 泛 型 机 制 (generic selection) 、 对 多 线程 的 支持 、 静 态 
叶 言 、 原 子 操作 以 及 对 Unicode 的 支持 。 本 书 将 主要 针对 C11 标 准 为 大 家 
详细 讲解 C 编 程 语言 。 关 于 C 语 言 历史 与 演化 进程 的 详细 介绍 可 参考 维 
基 百 


科 : https://en.wikipedia.org/wiki/C_%28programming_language%29。 


笔者 近 两 年 也 是 在 不 断 地 了 解 C 语 言 标准 委员 会 的 最 新 动态 (可 参 
见 : http:/www.open-std.org/jtcl/sc22/wg14/) ， 其 中 看 到 有 人 提出 想 为 C 
语言 添加 面向 对 象 的 特性 ， 包 括 增加 类 、 继 承 、 多 态 等 已 被 C++ 语言 所 
广泛 使 用 的 语法 特性 ， 但 是 最 终 被 委员 会 驳回 了 。 因 为 这 些 复杂 的 语法 








特性 并 不 符合 C 语 言 的 设计 理念 以 及 设计 哲学 ， 况且 C++ 已 经 有 了 这 些 
特性 ，C 语 言 无 需 再 对 它们 进行 支持 。 笔 者 将 在 第 19 章 给 大 家 谈 谈 C 语 
言 设 计 理 念 与 发 展 方 癌 。 





1.2 ”用 C 语 言 编程 的 基本 注意 事项 


C 语 言 的 发 明 其 实 基于 Unix 操 作 系统 。 当 时 在 C 语 言 未 面世 之 前 ， 
Dennis Ritchie 所 在 的 AT&T 贝 尔 实验 室 用 的 Unix 系 统 是 完全 用 汇编 语言 
写 的 。 汇 编 语 言 的 优势 是 直接 面向 处 理 器 本 身 ， 能 直接 对 底层 硬件 进行 
控制 ， 充 分 发 挥 处 理 器 的 硬件 能 力 。 然 而 ， 它 的 缺陷 也 是 显而易见 的 。 





1. 汇 编 语言 的 不 足 


首先 ， 不 可 移植 性 。 每 种 处 理 器 ， 其 指令 集 都 大 相 径 庭 ， 比 如 
ARM 有 ARM 的 指令 集 架 构 (ISA) ，Intel x86 有 x86 的 ISA， 还 有 MIPS、 
Power (原来 为 PowerPC) ，Motorola 68000 等 ， 再 加 上 各 类 微 控制 器 单 
元 (Micro-Controller Unit，MCU) 、 各 类 数字 信号 处 理 器 (Digital 
Signal Processor，DSP) ， 每 种 ISA 都 有 其 相应 的 汇编 语言 。 那 么 多 处 理 
器 如 果 对 每 一 种 都 使 用 不 同 的 汇编 语言 来 实现 同一 个 操作 系统 ， 那 操作 
系统 的 开发 人 员 真 要 骨 江 了 ...…... 而 且 即 便 实现 出 来 ， 可 能 各 个 处 理 器 上 
的 实现 也 会 有 所 不 同 ， 标 准 也 很 难 被 统一 起 来 。 




















其 次 ， 汇 编 语言 本 里 要 比 高 级 语言 精密 。 因 为 汇编 语言 面 对 的 都 是 
寄存 器 、 和 存储 名 以 及 各 类 确 层 硬件 ， 而 不 是 一 种 抽象 的 数据 模型 ， 所 以 
代码 编写 时 需要 非常 谨慎 ， 而 且 调 试 程序 也 十 分 抹 烦 ， 且 非常 容易 出 
错 。 所 以 ， 如 果 有 一 种 既 能 面 癌 底层 硬件 ， 又 能 对 数据 以 及 程序 进行 抽 














象 的 高 级 语言 出 现 ， 那 势必 既 能 不 太 影 响 程序 执行 效率 ， 又 能 大 大 提升 
程序 的 可 执行 性 、 可 读 性 以 及 编写 的 效率 ， 这 将 是 非常 伟大 的 页 献 。C 
语言 也 就 是 在 这 种 背景 下 诞生 的 。 

















如 果 说 ， 汇 编 语言 面向 的 是 底层 硬件、 一 种 过 程 化 的 编程 风格 的 
话 ， 那 么 C 语 言 就 是 面向 数据 流 和 算法 、 一 种 结构 化 的 编程 风格 。C 语 





言 是 一 种 结构 化 的 、 静 态 类 型 的 编译 型 编程 语言 。 也 就 是 说 ， 用 C 语 言 
编写 了 源 代码 之 后 ， 需 要 通过 C 语 言 编 译 右 进行 编译 ， 构 建 为 相应 的 处 
理 器 能 直接 执行 的 机 器 码 ， 然 后 处 理 器 可 以 对 生成 出 来 的 机 器 码 进行 执 
行 。 所 以 在 各 个 处 理 咒 上， 处 理 器 厂商 或 第 三 方 只 需要 为 当前 处 理 嚣 写 








一 个 对 应 的 C 语 言 编译 器 即 可 。 然 后 任何 符合 C 语 言 标准 的 程序 都 能 在 
上 面 编 译 后 执行 ， 除 了 需要 文 持 某 些 机 器 特定 的 功能 和 特性 外 《后 面 会 


四 洗 大 。 





2.C 语 言 编写 程序 要 注意 什么 
那么 我 们 在 用 C 语 言 写 程序 的 时 候 应 该 注意 哪些 方面 呢 ? 


1) 可 移植 性 : C 语 言 被 设计 出 来 的 一 大 初衷 就 是 为 了 能 将 同一 个 源 
代码 放 到 各 个 不 同 的 平台 上 编译 运行 。 因 此 ， 如 果 我 们 的 代码 要 在 多 种 
不 同 淋 构 的 处 理 器 上 运行 的 话 ， 我 们 束 得 注意 C 语 言 标准 规 定 了 哪些 特 








性 是 编译 需 必 须 遵守 的 ， 哪 些 特 性 是 平台 或 编译 器 目 己 实现 的 。 我 们 要 
尽量 使 用 标准 中 已 明文 规定 的 编程 规范 ， 尽 可 能 避免 在 不 同 平台 可 能 会 


产生 不 同行 为 的 语法 特性 。 当 然 ， 由 于 上 面 提 到 的 处 理 器 种 类 太 过 多 
样 ， 尤 其 在 租 入 式 开 发 领域 ， 很 多 MCU 用 的 还 都 是 8 位 处 理 器 ， 这 种 情 
况 下 C 源 代码 就 很 难 被 移植 到 32 位 或 64 位 系统 下 了 。 本 书后 面 将 会 指出 
大 部 分 主流 平台 对 C 语 言 标 准 中 所 提 到 的 “实现 定义 ”行为 的 区 别 。 男 

外 ， 也 会 提 到 一 些 技巧 来 应 对 不 同 的 平台 特性 。 











2) 可 维护 性 : 可 维护 性 在 实际 工程 项 目的 研发 中 非常 重要 。 它 体 
现在 最 初 工程 架构 的 设计 、 对 各 个 功能 模块 的 划分 、 相 应 的 开发 人 员 安 
排 ， 还 有 后 期 的 测试 。 一 般 来 说 ， 现 在 一 个 工程 如 果 是 从 无 到 有 进行 开 
发 的 话 会 采用 螺旋 式 开 有 模型 。 也 惑 是 说 ， 一 个 项 目 局 动 后 ， 可 以 先 做 
一 个 功能 简单 但 能 正常 工作 的 产品 原型 。 然 后 在 此 基础 上 不 断 地 为 它 增 
加 更 多 功能 ， 或 对 之 前 的 功能 进行 修改 。 在 此 期 间 ， 我 们 如 何 对 整个 工 
程 进行 模块 化 划分 ， 从 而 能 安排 不 同 开 发 人 员 针 对 不 同 功 能 模块 进行 开 
发 就 变 得 尤为 重要 。 妨 外 ， 在 工程 开发 过 程 中 ， 如 果 有 人 员 流 动 ， 那 么 
如 何 将 即将 离职 的 开发 人 员 手 中 的 工作 交付 给 新 人 也 关系 到 整个 项 目的 
进展 。 因 此 ， 一 个 良好 的 C 语 言 代 码 应 该 具有 可 读 性 、 民 好 的 文档 化 注 
释 风 格 ， 以 及 较 详 细 的 设计 文档 。 对 于 一 个 较 大 的 工程 项 目 来 说 ， 开 友 
人 员 不 仪 仪 需 要 把 自己 的 代码 写 好 ， 而 且 要 写 得 能 让 别人 看 刷 ， 并 且 要 
做 好 详细 的 设计 文档 ， 这 样 才能 把 项 目 风 险 降低 。 











3) 可 延展 性 ， 大 家 或 许 已 经 知道 ， 像 微软 的 Windows 操 作 系 统 由 
数 干 名 工程 师 合 作 研发 ，Linux 操 作 系 统 对 外 开源 ， 参 与 其 中 的 研发 人 


员 也 有 数 百 上 千 人 。 如 果 我 们 在 一 个 开发 团队 中 负责 一 个 需要 由 多 人 合 
作 开 发 的 工程 项 目 ， 那 么 我 们 写 的 功能 模块 需要 与 其 他 人 写 的 功能 模块 
进行 对 接 。 所 以 ， 我 们 在 开发 一 个 较 大 工程 项 目 时 ， 需 要 协调 好 各 自 对 
外 的 模块 接口 (Application Program Interface，API) 。 由 于 C 语 言 没 有 
全 局 名 字 空 间 (namespace) 这 个 概念 ， 所 以 命名 一 个 对 外 接口 也 是 非 
常 重要 的 ， 否 则 可 能 会 与 其 他 功能 模块 的 接口 名 发 生 冲 突 。 本 书后 面 会 
对 C 语 言 函 数 命名 以 及 符号 连接 做 进一步 介绍 。 





4) 性 能 : 性 能 是 提升 程序 使 用 者 效率 和 生产 力 的 体现 。 一 个 应 用 
程序 的 性 能 越 高 ， 那 么 计算 一 个 任务 所 人 花费 的 时 间 越 得， 也 越 贡 省 计算 
机 的 耗 电 。 而 对 于 如 何 提升 性 能 ， 一 方面 需要 程序 员 对 处 理 器 架构 、 硬 
件 特 性 有 一 定 了 解 ， 男 一 方面 需要 程序 员 拥有 比较 丰富 的 算法 知识 ， 能 
针对 实际 需求 灵活 采用 高 效 的 算法 。 而 像 C 语 言 这 种 十 分 接近 人 硬件 底层 
的 局 级 编程 语言 ， 能 极 大 限度 地 发 挥 处 理 器 的 特长 ， 从 而 达到 高 效 的 运 


行 性 能 。 




















1.3 主流 C 语 言 编 译 器 介绍 


对 于 当前 主流 更 面 操 作 系统 而 言 ， 可 使 用 Visual C++、GCC 以 及 
LLVM Clang 这 三 大 编译 器 。 其 中 ，Visual C++ (简称 MSVC) 只 能 用 于 
Windows 操 作 系统 ， 其 余 两 个 ， 除 了 可 用 于 Windows 操 作 系 统 之 外 ， 主 
要 用 于 Unix/Linux 操 作 系 统 。 像 现在 很 多 版 本 的 Linux 都 默认 使 用 GCC 作 
为 C 语 言 编译 器 。 而 像 FreeBSD、macOS 等 系统 默认 使 用 LLVM Clang 编 
译 器 。 由 于 当前 LLVM 项 目 主要 在 Apple 的 主推 下 发 展 的 ， 所 以 在 
macOS 中 ，Clang 编 译 器 又 被 称 为 Apple LLVM 编 译 器 。MSVC 编 译 器 主 
要 用 于 Windows 操 作 系 统 平台 下 的 应 用 程序 开发 ， 它 不 开源 。 用 户 可 以 
使 用 Visual Studio Community 版 本 来 免费 使 用 它 ， 但 是 如 果 要 把 通过 
Visual Studio Community 工 具 生 成 出 来 的 应 用 进行 商用 ， 那 么 就 得 好 好 
阅读 一 下 微软 的 许可 证 和 说 明 书 了 。 而 使 用 GCC 与 Clang 编 译 器 构建 出 
来 的 应 用 一 般 没 有 任何 限制 ， 程 序 员 可 以 将 应 用 程序 随意 发 布 和 进行 商 
用 。 不 过 由 于 MSVC 编 译 器 对 C99 标 准 的 支持 就 十 分 有 限 ， 加 之 它 压 根 
不 支持 任何 C11 标 准 ， 所 以 本 书 的 代码 例子 不 会 针对 MSVC 进 行 描述 。 
所 幸 的 是 ，Visual Studio Community 2017 加 入 了 对 Clang 编 译 器 的 支持 ， 
官方 称 之 为 
3.8。 也 就 是 说 ， 应 用 于 Visual Studio 集 成 开发 环境 中 的 Clang 编 译 器 前 端 
可 支持 Clang 编 译 器 的 所 有 语法 特性 ， 而 后 端 生成 的 代码 则 与 MSVC 效 








Clang with Microsoft CodeGen， 当 前 版 本 基于 的 是 Clang 








果 一 样 ， 包 括 像 long 整 数 类 型 在 64 位 编译 模式 下 长 度 仍然 为 4 个 字 节 ， 
所 以 各 位 使 用 的 时 候 也 需要 注意 。 为 了 方便 摘 述 ， 本 书后 面 涉 及 Visual 
Studio 集 成 开发 环境 下 的 Clang 编 译 器 简称 为 VS-Clang 编 译 器 。 





而 在 众 入 式 系统 方面 ， 可 用 的 C 语 言 编译 器 就 非常 丰富 了 。 比 如 用 
于 Keil 公 司 51 系 列 单片机 的 Keil C51 编 译 器 ; 当前 大 红 大 紫 的 Arduino 板 
搭载 的 开发 套件 ， 可 用 针对 AVR 微 控制 器 的 AVR GCC 编译 妖 ，ARM 目 
己 出 的 ADS (ARM Development Suite) 、RVDS (RealView 
Development Suite) 和 当前 最 新 的 DS-5 Studio; DSP 设 计 商 TI (Texas 
Instruments) 的 CCS (Code Composer Studio) ; DSP 设 计 商 
ADI (Analog Devices，Inc.) 的 Visual DSP++ 编 译 器 ， 等 等 。 通 常 ， 用 
于 和 骨 入 式 系统 开发 的 编译 工具 链 都 没有 免费 版 本 ， 而 且 一 般 需 要 通过 甘 
内 代理 进行 购买 。 所以， 这 对 于 个 人 开发 者 或 者 散 入 式 系 统 爱 好 者 而 
是 一 道 不 低 的 门槛 。 不 过 Arduino 的 开发 套件 是 可 免费 下 载 使 用 的 ， 并 
且 用 它 做 开发 板 连 接 调试 也 十 分 简单 。Arduino 所 采用 的 C 编 译 器 是 基于 
GCC 的 。 还 有 像 树 莓 派 〈Raspberry Pi) 这 种 迷你 电脑 可 以 直接 使 用 
GCC 和 Clang 编 译 器 。 此 外 ， 还 有 像 nVidia 公司 推出 的 Jetson TK 系列 开 
发 板 也 可 直接 使 用 GCC 和 Clang 编 译 器 。 树 每 派 与 Jetson TK 都 默认 安装 
了 Linux 操 作 系统 。 在 艇 入 式 领 域 ， 一 般 比 较 低 端的 单片机 ， 比 如 8 位 的 
MCU 所 对 应 的 C 编 译 器 可 能 只 支持 C90 标 准 ， 有 些 甚 至 连 C90 标 准 的 很 
多 特性 都 不 支持 。 因 为 它们 一 方面 内 存 小 ROM 的 容量 也 小 ， 另 一 方 
面 ， 本 身 处 理 器 机 能 就 十 分 有 限 ， 有 些 甚至 无 法 文 持 函数 指针 ， 因 为 处 
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理 器 本 身 不 包含 通过 寄存 器 做 间接 过 程 调用 的 指令 。 而 像 32 位 处 理 器 或 
DSP， 一 般 都 至 少 能 支持 C99 标 准 ， 它 们 本 身 的 性 能 也 十 分 强大 。 而 像 
ARM 出 的 RVDS 编 译 器 甚至 可 用 GNU 语 法 扩展 。 


图 1-1 展 示 了 上 述 C 语 言 编译 器 的 分 类 。 


Unix/Linux 系 统 
OS X/iOS 系 统 








Visual DSP++ 


图 1-1 C 语 言 编译 器 的 分 类 


1.4 关于 GNU 规 范 的 语法 扩展 


GNU 是 一 球 能 用 于 构建 类 Unix 操 作 系 统 的 计算 机 软件 合集 ， 由 自由 
软件 之 父 Richard Stallman 开 创 ， 于 1983 年 9 月 27 日 对 外 发 布 。GNU 完 全 
由 自由 软件 (free software) 构成 。GNU 语 法 扩展 源 自 于 GCC 编译 器 ， 
在 1987 年 发 布 1.0 版 本 ， 称 为 GNU C Compiler。 随 后 ，GCC 编 译 器 前 端 
中 支 持 了 C++、Objective-C/C++、Fortran、Ada、Java 以 及 最 近 跃 升 的 
Go 等 编程 语言 ， 因 此 现在 GCC 被 称 为 GNU Compiler Collection。 由 于 在 
20 世 纪 90 年 代 ，GNU C 编 译 器 就 对 C90 标 准 做 了 相当 多 的 语法 扩展 ， 包 
括 复合 字面 量 、 匿 名 结构 体 和 数组 、 可 指定 的 初始 化 器 等 ， 这 些 语法 扩 
展 被 广泛 使 用 ， 尤 其 是 大 量 用 于 Linux 内 核 代码 中 ， 因 此 C99 标 准将 这 些 
语法 特性 全 都 列 入 标准 之 中 。 








正 因为 GCC 本 身 是 开源 自由 软件 ， 因 此 很 多 商用 编译 器 也 基于 GCC 
进行 扩展 。 像 ARM 的 RVCT (RealView Compiler Toolkit) 本 身 就 支持 
GNU 扩 展 。 还 有 不 少 开 发 平台 本 身 就 直接 使 用 GCC 编译 工具 。 由 于 有 
不 少 大 公司 顶级 开发 人 员 的 参与 ， 因 此 GCC 编译 器 的 目标 代码 优化 能 
相当 高 ， 而 且 还 支持 许多 不 同 的 处 理 器 。 所 以 ，GCC 当 前 被 广泛 使 用 并 
博得 开发 者 的 好 评 。 像 Linux 操 作 系 统 基 本 默认 使 用 GCC 作为 默认 编译 
器 ， 包 括 Android 的 NDK 开 发 工具 一 开始 也 是 如 此 。 


然而 ， 由 于 GCC 基于 比较 严格 的 GPL 许可 证 ， 许 多 大 型 商业 开发 商 
对 它 望 而 却步 。 该 许可 证 允许 使 用 者 免费 使 用 软件 ， 但 是 要 求 不 能 随意 
对 它 进 行 自 改 并 重新 发 布 。 如 果 开 发 者 对 它 进 行 算 改 ， 然 后 发 布 自己 修 
改 之 后 的 软件 ， 那 么 必须 要 把 自己 修改 的 那 部 分 也 开源 出 来 。 因 此 ， 在 
2003 年 诞生 了 一 个 LLVM 开 源 项 目 ， 基 于 更 为 宽松 的 BSD 许 可 证 ， 其 编 
译 嚣 称 为 Clang。BSD 许 可 证 允许 开发 者 随意 对 软件 进行 修改 并 重新 发 
布 ， 甚 至 可 以 将 修改 过 的 版 本 作为 自主 版 权 ， 因 而 这 个 许可 证 深 受 大 公 
司 的 欢迎 。 现 在 Apple 对 LLVM 项 目的 投入 非常 大 。macOS 上 的 开发 工 
有 具 Xocde 从 4.0 版 本 起 就 开始 使 用 Clang 编 译 工 具 链 ， 随 后 Apple 将 自己 改 
写 的 Clang 编 译 器 称 为 Apple LLVM。 当 前 最 新 的 Xcode 8 所 使 用 的 Apple 
LLVM 版 本 为 8.x。 而 当前 Android NDK 也 支持 了 Clang 编 译 器 工具 链 。 
Clang 编 译 器 并 非 基于 GCC， 它 是 从 头 开始 写 的 。 但 是 它 的 目标 是 尽量 
与 GCC 编译 器 兼容 ， 所 以 Clang 编 译 器 包含 大 部 分 GNU 语 法 扩展 ， 除 此 
之 外 还 含有 它 自己 特有 的 C 语 言 扩展 。 当 然 也 有 一 些 特性 是 GCC 含有 而 
Clang 不 具备 的 ， 不 过 这 些 特性 一 般 很 少 使 用 。 





我 们 现在 可 以 看 到 GNU 语 法 扩展 适用 性 十 分 广泛 。 如 果 读 者 当前 在 
做 Linux/Unix 或 Windows 上 的 C 语 言 编 程 开发 ， 或 者 是 在 开发 macOSViOS 
应 用 ， 又 或 者 是 在 开发 Android 应 用 ， 那 么 完全 可 以 宣 无 顾忌 地 使 用 
GNU 语 法 扩展 。 本 书 最 后 几 个 章节 会 分 别 介绍 GCC 编译 器 特定 的 语法 
扩展 以 及 Clang 编 译 器 特定 的 语法 扩展 。 由 于 Clang 编 译 器 已 经 包含 了 大 
部 分 GNU 语 法 扩展 ， 因 此 在 介绍 GCC 语法 扩展 的 时 候 ， 如 果 当 前 特性 











Clang 不 文 持 ， 则 会 指明 。 





[1] 源 代 码 编译 流程 请 见 1.5 节 图 1-2。 


1.5 用 C 语 言 构建 一 个 可 执行 程序 的 方程 





从 用 C 语 言 写 源 代码 ， 然 后 经 过 编译 器 、 连 接 器 到 最 终 可 执行 程序 
的 流程 图 大 致 如 图 1-2 所 示 。 


从 图 1-2 中 我 们 可 以 清晰 地 看 到 C 语 言 编 译 器 的 大 致 流程 。 首 先 ， 我 
们 先 用 C 语 言 把 源 代码 写 好 ， 然 后 交 给 C 语 言 编译 器 。C 语 言 编译 器 内 部 
分 为 前 端 和 后 端 。 前 端 负责 将 C 语 言 代码 进行 词法 和 语法 上 的 解析 ， 然 
后 可 以 生成 中 间 人 代码。 中间 代码 这 部 分 不 是 必须 的 ， 但 是 它 能 够 为 程序 
的 跨 平台 移植 带 来 诸多 好 处 。 比 如 ， 同 样 的 一 份 C 语 言 源 代码 在 一 台 计 
算 机 上 编译 完 之 后 ， 生 成 一 套 中 间 代 码 。 然 后 针对 不 同 的 目标 平台 ( 比 
如 要 将 这 一 套 代 码 分 别 编译 成 ARM 处 理 器 的 二 进 制 机 器 码 、MIPS 处 理 
器 的 二 进 制 机 器 码 以 及 x86 处 理 器 的 二 进 制 机 器 码 ) ， 只 需要 编写 相应 
目标 平台 的 编译 器 后 端 即 可 。 所 以 ， 这 么 做 就 可 以 把 编译 器 的 前 端 与 后 
端 剥 离开 来 〈 这 在 软件 工程 上 又 可 称 为 解 耦合 ) ， 不 同 处 理 器 厂商 可 以 
针对 自家 的 处 理 器 特性 ， 对 中 间 代 码 生成 到 目标 二 进 制 代码 的 过 程 再 度 
进行 优化 。 接 下 来 ， 由 C 语 言 编译 器 后 端 生 成 源 文件 相应 的 目标 文件 。 
目标 文件 在 Windows 系 统 上 往往 是 .obj 文 件 ， 而 在 Unix/Linux 系 统 上 往往 
是 .0 文件 。C 语 言 的 源 文 件 在 所 有 平台 上 都 统一 用 .c 文 件 表示 。 最 后 ， 对 
于 各 个 独立 的 目标 文件 ， 通 过 连接 器 将 它们 合并 成 一 个 最 终 可 执行 文 
件 。 连 接 器 与 C 语 言 编译 器 是 完全 独立 的 。 所 以 ， 只 要 最 终 目标 代码 的 


























ABI《 应 用 程序 二 进 制 接 口 ) 一 致 ， 我 们 可 以 把 各 个 编译 如 生 成 的 目标 
代码 都 放 在 一 起 ， 最 后 连接 生成 一 个 可 执行 文件 。 比 如 ， 有 些 源 代 码 可 
用 GCC 编译 ， 有 些 使 用 Clang 编 译 ， 还 有 些 汇 编 语言 源 文 件 可 直接 通过 
汇编 器 生成 目标 代码 ， 最 后 将 所 有 这 些 生成 出 来 的 目标 代码 连接 为 可 执 
行文 件 。 最 终 用 户 可 以 在 当前 的 操作 系统 上 加 载 可 执行 文件 进行 执行 。 
操作 系统 利用 加 载 器 将 可 执行 文件 中 相关 的 机 需 码 存放 到 内 存 中 来 执行 
应 用 程序 。 
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图 1-2 ”CC 语言 源 代码 编译 流程 图 














1.6 ”本章 小 结 


本 章 简要 地 介绍 了 计算 编程 语言 的 分 类 ， 描 述 了 C 语 言 的 历史 及 沉 
化 ， 以 及 C 语 言 的 编程 思想 。 此 外 还 介绍 了 GNU 的 来 龙 去 脉 以 及 C 语 言 
编译 器 将 C 语 言 代 码 翻译 成 最 终 机 口 人 码 的 大 致 流程 。 








C 语 言 作为 一 门 更 接近 人 硬件 底层 的 高 级 编程 语言 具有 展 好 的 抽象 
力 、 表 达 力 和 灵活 性 。 此 外 ， 它 共有 非常 蜗 效 的 运行 时 性 能 。 妆 前 的 C 
语言 编译 璐 最 终 翻 译 成 的 机 器 指令 人 码 与 我 们 手工 写 汇 编 语言 所 得 到 的 性 
能 在 大 部 分 情况 下 相差 无 几 。C 语 言 基本 能 达成 我 们 对 性 能 的 要 求 ， 而 
在 某 些 对 性 能 要 求 十 分 严 苛 的 热点 〈hotspot) 上， 我 们 可 以 对 这 些 功能 
模块 手工 编写 汇编 代码 。C 语 言 与 汇编 语言 的 ABI 是 完全 兼容 的 ， 而 且 
大 部 分 C 语 言 编 译 器 还 文 持 直 接 内 联 汇编 语 言 。 因 此 ，C 语 言 从 1970 年 
直到 现在 都 是 系统 级 编程 的 首要 编程 语言 。 






































第 2 章 ”学 习 C 语 言 的 预备 知识 





我 们 在 第 1 章 已经 大 致 介绍 了 C 语 言 的 概念 以 及 编译 、 连 接 流程 。 我 
们 知道 C 语 言 是 高 级 语言 中 比较 侦 便 件 确 层 的 编程 语言 ， 因 此 对 于 用 C 
语言 的 编程 人 员 而 言 ， 了 解 一 些 关 于 处 理 器 架构 方面 的 知识 是 很 有 必要 
的 ， 对 于 磐 入 式 系统 开发 的 程序 员 而 言 更 是 如 此 了 。 


























男 外 ，C 语 言 中 有 很 多 按 位 计算 以 及 逻辑 计算 ， 所 以 对 于 初学 者 来 
次， 如果 对 整数 编码 方式 等 计算 机 基础 知识 不 熟悉 ， 那 么 对 这 些 操作 的 
理解 也 会 变 得 十 分 困难 。 因 此 ， 本 章 将 主要 给 C 语 言 初 学 者 、 同 时 也 征 
计算 机 编程 初学 者 ， 提 供 计 算 机 编程 中 会 涉及 的 基本 知识 ， 这 样 ， 在 本 
书后 面 讲解 到 一 系列 相关 概念 时 ， 初 学 者 也 不 会 感到 陌生 。 














2.1 计算 机 体系 结构 简介 


图 2-1 为 一 个 简单 的 计算 机 体系 结构 图 。 


一 个 人 简单 的 计算 机 系统 包含 了 中 央 处 理 嚣 (CPU) 以 及 存储 器 和 其 
他 外 部 设备 。 而 在 CPU 内 部 则 由 计算 单元 、 通 用 目的 寄存 器 、 程 序 序列 
器 、 数 据 地 址 生成 器 等 部 件 构成 。 下 面 我 们 将 从 外 到 内 分 别 简单 地 介绍 


这 些 组 件 。 
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贮存 器 《〈Storage) 尽管 在 图 2-1 中 没有 表示 出 来 ， 但 我 们 对 它 一 定 
不 会 陌生 ， 比 如 我 们 在 PC 上 使 用 的 硬盘 (Hard Disk) 就 是 一 种 贮存 
器 。 贮 存 器 是 一 种 存储 器 ， 不 过 它 可 用 于 持久 保存 数据 而 不 丢失 。 因 此 
我 们 通常 把 具有 可 持久 保存 的 存储 器 统称 为 贮存 器 。 现 在 PC 上 用 得 比 
较 现代 化 的 贮存 器 就 是 SSD 〈Solid-State Disk) 了， 俗称 固态 硬盘 。 当 
然 ， 贮 存 器 就 其 存储 介质 来 说 属于 ROM (Read-Only Memory) ， 即 只 
读 存 储 器 。 这 类 存储 器 的 特点 是 数据 能 持久 保留 ， 比 如 我 们 PC 上 的 文 
件 ， 即 便 在 关闭 计算 机 之 后 也 一 直 会 保存 在 你 的 硬盘 上 ， 而 且 PC 上 的 
软件 往往 也 是 以 可 执行 文件 的 形式 保存 在 硬盘 上 的 。 但 是 它 的 读 写 速度 
非常 缓慢 ， 尤 其 是 老式 的 SATA 磁 盘 ， 写 操作 则 更 慢 。 因 为 通常 对 ROM 








的 数据 修改 都 要 通过 先 读 取 某 段 数据 所 在 的 而 区 ， 然 后 对 该 数据 进行 修 
改 ， 再 擦 除 所 涉及 的 履 区 ， 最 后 把 修改 好 的 数据 所 包含 的 局 区 再 写 回 
去 。 而 对 于 ROM 来 说 ， 其 忆 区 是 有 写 入 次 数 限制 的 ， 所 以 写 入 次 数 越 
多 ， 损 耗 就 越 大 。 当 我 们 发 现 一 个 硬盘 访问 很 慢 的 时 候 ， 通 常 就 是 其 而 
区 《或 磁道 ) 已 经 破损 严重 了 ， 这 是 在 不 断 纠 错 并 交换 良好 的 扇 区 所 引 
发 的 延迟 。 在 和 通 入 式 系统 中 ， 我 们 用 的 ROOM 一般 是 EPROM、 
EEPROM、Flash ROM 等 。 这 些 硬件 的 详细 资料 各 位 可 以 从 网 上 轻易 获 
得 ， 这 里 不 再 袭 述 。 
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图 2-1 简单 的 计算 机 体系 结构 图 


2.1.2 存储 器 


存储 占 (Memory) 一 般 是 指 我们 通常 所 说 的 内 存 或 主 存 (Main 
Memory) 。 其 存储 介质 属于 RAM (Random Access Memory) ， 即 随机 


访问 存储 器 。 它 的 特点 是 访问 速度 快 ， 可 对 单个 字 节 进行 读 写 ， 这 与 
ROM 需 要 擦 除 整 个 忆 区 再 对 整个 扇 区 写 入 的 方式 有 所 不 同 ， 因 此 更 高 
效 、 灵 活 。 但 是 RAM 的 数据 无 法 持久 化 ， 掉 电 之 后 就 会 消失 。 此 外 ， 

RAM 的 成 本 也 比 ROM 高 郧 得 多 ， 我 们 对 比 一 下 16GB 的 内 存 条 与 256GB 
SSD 的 价格 就 能 知道 。 然 而 正 因为 RAM 的 访问 速度 快 ， 并 且 离 CPU 更 
近 ， 所 以 在 许多 系统 中 都 是 将 程序 代码 与 数据 先 读 取 到 RAM 中 之 后 再 
让 CPU 去 执行 处 理 的 。 当 然 ， 在 一 些 艇 入 式 系 统 中 也 有 让 CPU 直 接 执行 
ROM 中 的 代码 并 访问 读 ROM 中 常量 数据 的 情况 ， 因 为 这 类 系统 中 总 线 
频率 以 及 CPU 频 率 都 相对 较 低 ， 并 有 旦 ROM 也 是 与 CPU 以 SoC (System- 
On-Chip， 系 统 级 芯片 ) 的 方式 整合 在 一 块 芯 片上 的 ， 所 以 访问 成 本 要 
低 很 多 。 而 有 些 环 境 对 ROM 的 读 取 速 度 甚 至 比 读 取 RAM 还 更 快 些 。 





OO, 在 本 书 中 所 出 现 的 “存储 器 *” 均 表示 内 存 ， 即 RAM。 而 将 
可 持久 保存 数据 的 存储 器 都 一 律 称 为 “贮存 占 *>。 了 解 了 这 些 概 念 后 ， 我 
们 在 国外 网 站 购买 Mac 或 PC 时 ， 看 到 相关 的 术语 就 不 会 手足 无 措 了 。 这 
里 提供 Apple 美 国 官 网 的 Mac 配 置信 息 网 页 ， 各 位 可 以 参 


考 ; www.apple.com/macbook-pro/specs/。 


2.1.3 寄存 器 


寄存 器 是 在 CPU 核心 中 的 、 用 于 和 暂 存 数据 的 存储 单元 。 一 般 处 理 器 





内 部 对 数据 的 算术 逻辑 计算 往往 都 需要 通过 寄存 器 〈Register) ， 而 不 
是 直接 对 外 部 存储 器 进行 操作 。 因 此 ， 如 果 我 们 要 计算 一 个 加 法 或 乘法 
计算 ， 需 要 先 把 相关 数据 从 外 部 存储 器 读 到 处 理 器 自己 的 通用 目的 寄存 
医 中 ， 然 后 对 寄存 器 做 计算 操作 ， 再 将 计算 结果 也 放 入 寄存 器 ， 最 后 将 
结果 寄存 器 中 的 数据 再 写 入 外 部 存储 器 。 寄 存 器 的 访问 速度 非常 快 ， 它 
是 这 三 种 存储 介质 中 速度 最 快 的 ， 但 是 数量 也 是 最 少 的 。 像 在 传统 的 32 
位 x86 处 理 器 体系 结构 下 ， 程 序 员 一 般 能 直接 用 的 通用 目的 寄存 器 只 有 
EAX、EBX、ECX、EDX、ESI、EDI、EBP 这 7 个 。 还 有 一 个 ESP 用 于 
操作 堆栈 ， 往 往 无 法 用 来 处 理 通用 计算 。 
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计算 单元 一 般 由 算术 逻辑 单元 (ALU) 、 乘 法 器 、 移 位 器 构成 。 当 
然 ， 像 一 般 局 级 点 的 处 理 器 还 包含 除法 占 ， 以 及 用 于 做 浮 点 数 计 算 的 浮 
点 处 理 单 元 (FPU〉。 它 们 一 般 都 直接 对 寄存 器 进行 操作 。 而 涉及 数据 
读 写 的 指令 会 由 专门 的 加 载 、 存 储 处 理 单元 进行 操作 。 





2.1.5 程序 执行 流程 


处 理 霹 在 执行 一 段 程 序 时 ， 通 利多 从 外 部 存储 融 取 得 指令 ， 然 后 对 
指令 进行 译 码 处 理 ， 转 换 为 相关 的 一 系列 操作 。 这 些 操作 可 能 是 对 寄存 


器 的 算术 逻辑 运算 ， 也 可 能 是 对 存储 需 的 读 写 操作 ， 然 后 执行 相关 计 
算 。 最 后 把 计算 结果 写 回 寄存 器 或 写 回 到 存储 器 。 不 过 处 理 器 在 执行 一 
系列 指令 的 时 候 并 不 是 每 条 指令 都 必须 先 经 过 上 面 所 描述 的 整个 过 程 才 
能 执行 下 一 条 ， 而 是 采用 流水 线 的 方式 执行 ， 如 图 2-2 所 示 。 














图 2-2 体 现 了 一 个 简单 的 处 理 占 执行 完 一 条 指令 的 完整 过 程 。 我 们 
这 里 假设 从 第 一 个 取 指 令 阶 段 到 最 后 的 写 回 阶段 ， 这 5 个 阶段 均 花 费 1 个 
周期 ， 倘 硅 不 是 采用 流水 线 的 方式 ， 而 是 每 完成 一 条 指令 的 执行 再 执行 
下 一 条 指令 ， 那 么 每 条 指令 的 处 理 都 需要 5 个 周期 。 而 一 旦 采用 流水 线 
方式 处 理 ， 那 么 我 们 可 以 看 到 ， 在 第 一 条 指令 执行 到 译 码 阶段 时 ， 处 理 
胡可 以 对 第 二 条 指令 做 取 指 令 操作 ; 当 第 一 条 指令 执行 到 执行 阶段 时 ， 
第 二 条 指令 执行 到 了 译 码 阶段 ， 此 时 第 三 条 指令 开始 做 取 指 令 阶 段 ， 然 
后 以 此 类 推 。 这 样 ， 当 整 条 流水 线 填充 满 之 后 ， 即 执行 到 了 第 5 条 指 
令 ， 那 么 对 于 后 续 指 令 而 言 ， 处 理 每 一 条 指令 的 时 间 均 只 需要 一 个 周 
期 。 
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图 2-2 处理 絮 执 行 流水 线 


这 里 需要 注意 的 是 ， 并 不 是 每 条 指令 都 需要 访 存 操作 ， 只 有 当 需 要 
对 外 部 存储 器 做 读 写 操作 时 才 会 动用 访 存 执行 单元 。 然 而 大 部 分 指令 都 
需要 写 回 寄存 器 操作 ， 即 便 像 一 条 用 于 比较 大 小 的 指令 ， 或 一 条 系统 中 
叶 指 令 ， 它 们 也 会 影响 状态 寄存 占 。 当 然 ， 很 多 处 理 右 会 有 空 操作 
(NOP) 指令 ， 它 仅仅 占用 一 个 时 钟 周期 ， 而 不 会 对 除了 指令 指针 寄存 
右 以 外 的 任何 寄存 器 产生 影响 。 











2.2 整数 在 计算 机 中 的 表示 


我 们 日 常用 的 整数 都 是 十 进 制 数 (Decimal ) ， 也 就 是 我 们 通常 所 
说 的 着 十 进 一 。 因 为 我 们 人 类 有 十 根 手 指 ， 所 以 自然 而 然 地 会 想到 采用 
十 进 制 的 计数 和 计算 方式 。 然 而 ， 现 在 几乎 所 有 计算 机 都 采用 二 进 制 数 
(Binary)〉 编码 方 式 ， 所 以 我 们 日 常 所 用 到 的 整数 如 果 要 用 计算 机 来 表 
示 的 话 ， 需 要 表示 成 二 进 制 的 方式 。 


二 进 制 数 则 是 着 二 进 一 ， 所 以 在 整 串 数 中 只 有 0 和 1 两 种 数字 。 比 

如 ， 十 进 制 数 9?， 对 应 三 进 制 为 0; 十进制 数 1， 对 应 二 进 制 数 1， 十 进 制 
数 2， 对 应 二 进 制 数 10， 十 进 制 数 3， 对 应 二 进 制 数 11。 因 此 ， 对 于 非 负 
整数 而 言 ， 二 进 制 数 第 n 位 〈n 从 0 开始 计 ) 如 果 是 1， 那 么 就 对 应 十 进 制 
数 的 如 ， 然 后 每 个 位 计算 得 到 的 十 进 制 数 再 依次 相 加 得 到 最 终 十 进 制 数 
的 值 。 比 如 ， 一 个 5 位 二 进 制 数 10010， 最 低位 为 最 右边 的 位 ， 记 为 0 号 
位 ， 数 值 为 0， 最 高 位 为 最 左边 的 位 ， 记 为 4 号 位 ， 数 值 为 1。 那 么 它 所 
对 应 的 十 进 制 数 为 : 24+21=18。 因 为 该 二 进 制 数 除了 4 号 位 和 1 号 位 为 1 
之 外 ， 其 余 位 都 是 9， 因 此 0 乘 以 2"? 表 定 为 0。 图 2-3 为 二 进 制 数 10010 换 
算 成 十 进 制 数 的 方法 图 。 
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二 进 制 数 10010 对 应 的 十 进 制 数值 为 
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图 2-3 ”5 位 二 进 制 数 对 应 十 进 制 的 计算 





在 计算 机 术语 中 ， 把 二 进 制 数 中 的 某 一 位 数 又 称 为 一 个 比特 

Cbit) 。 比 特 这 个 单位 对 于 计算 机 而 言 ， 在 度量 上 是 最 小 的 单位 。 除 了 
比特 之 外 ， 还 有 字 节 〈byte) 这 个 术语 。 一 个 字 节 由 8 个 比特 构成 。 在 
某 些 单片机 架构 下 还 引入 了 半 字 节 (nybble 或 nibble) 这 个 概念 ， 表 示 4 
个 比特 。 然 后 ， 还 有 字 (word〉 这 个 术语 。 字 在 不 同 计算 机 架构 下 表示 
的 含义 不 同 。 在 x86 架 构 下 ， 一 个 字 为 2 个 字 节 ;而 在 ARM 等 众多 32 位 
RISC 体 系 结构 下 ， 一 个 字 表 示 为 4 个 字 节 。 随 着 计算 机 带宽 的 提升 ， 能 
被 处 理 器 一 次 处 理 的 数据 宽度 也 不 断 提 升 ， 因 此 出 现 了 双 字 (double 
word) 、 四 字 (guad word) 、 八 字 (octa word) 等 概念 。 双 字 的 宽度 
为 2 个 字 ， 四 字 宽 度 为 4 个 字 ， 所 以 它们 在 不 同 处 理 器 体系 结构 下 所 占用 
的 字 节 个 数 也 会 不 同 。 











我 们 上 面 介绍 了 非 负 整数 的 二 进 制 表达 方法 ， 那 么 对 于 人 负数， 二 进 
制 又 该 如 何 表达 呢 ? 在 计算 机 中 有 原 码 和 补 码 两 种 表示 方法 ， 而 最 为 常 
用 的 是 补 码 的 表示 方法 。 下 面 我 们 分 别 对 原 码 和 补 码 进行 介绍 。 





2.2.1 原 码 表示 法 


对 于 无 正 负 符号 的 原 码 ， 其 二 进 制 表达 如 上 节 所 述 。 而 对 于 含有 正 
负 符 号 的 原 码 ， 进 制 表 示 含 有 一 位 符号 位 ， 用 于 表示 正 负 号 。 
都 是 以 二 进 制 数 的 最 高 有 效 位 〈 即 最 左边 的 比特 ) 作为 符号 位 ， 其 余 各 
位 比特 表示 该 数 的 绝对 值 大 小 。 比 如 ， 十 进 制 数 6 用 一 个 8 位 的 原 码 表示 
为 00000110; 如果 是 -6， 则 表示 为 10000110。 二 进 制 的 原 码 表示 示例 如 
图 2-4 所 示 。 
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对 应 十 进 制 数 为 ，- 
图 2-4 二进制 数 的 原 码 表 示 








原 码 的 表示 非常 直观 ， 但 是 对 于 计算 机 算术 运算 而 言 就 带 来 了 许多 
诬 烦 。 比 如 ， 我 们 用 上 述 的 6 与 -6 相 加 ， 即 00000110+10000110， 结 果 为 
10001100， 也 就 是 十 进 制 数 -12， 显 然 不 是 我 们 想 要 的 结果 。 所 以 ， 如 
果 某 个 处 理 器 用 原 码 表示 二 进 制 数 ， 那 么 它 参 与 加 减法 的 时 候 必须 对 两 


个 操作 数 的 正 负 符 号 加 以 判断 ， 然 后 再 判定 使 用 加 法 操作 还 是 减法 操 
作 ， 最 后 还 要 判定 结果 的 正 猴 符号， 可 谓 相 当 麻 烦 。 所 以 ， 当 前 计算 机 
的 处 理 嚣 往往 采用 补 码 的 方式 来 表达 带 符 与 的 二 进 制 数 。 





2.2.2 ” 补 码 表示 法 








正 由 于 原 码 售 有 上 述 缺 后， 所 以 人 们 开发 出 了 男 一 种 市 符号 的 二 进 
制 码 表示 法 一 一 补 码 。 补 码 与 原 码 一 样 ， 用 最 高 位 比特 表示 符号 位 ， 其 
余 各 位 比特 则 表示 数值 大 小 。 如 末 符 号 位 为 0， 说 明 整 个 二 进 制 数 为 正 
数 或 零 ， 如 果 为 1， 那 么 表示 整个 二 进 制 数 为 负数 。 当 符号 位 为 0 时 ， 二 
进 制 补 码 表示 法 与 原 码 一 模 一 样 ， 但 是 当 符 号 位 为 负数 时 ， 情 况 就 完全 
不 同 了 。 此 时 ， 对 二 进 制 数 的 补 码 表示 需要 按 以 下 步骤 进行 : 


























1) 先 将 该 二 进 制 数 以 绝对 值 的 原 码 形式 写 好 ; 


2) 对 整个 二 进 制 数 〈 包 括 符号 位 ) ， 每 一 个 比特 都 取 反 。 所 谓 取 
反 就 是 说 ， 原 来 一 个 比特 的 数值 为 0 时 ， 则 要 变 1; 为 1 时 ， 则 要 变 0。 


变换 好 之 后 ， 将 二 进 制 数 做 加 1 计算 ， 节 终结 果 就 是 该 负数 的 补 码 
值 了 。 


下 面 我 们 还 是 用 6 来 举例 ，+6 的 三 进 制 补 码 跟 原 码 一 样 ， 还 是 
00000110。 而 -6 的 计算 过 程 ， 按 照 上 述 流程 如 下 : 


1) 先 将 -6 用 绝对 值 +6 的 形式 表示 : 00000110; 


2) 对 每 个 比特 位 取 反 ， 包 括 符号 位 在 内 ， 得 到 : 11111001; 


3) 将 变换 好 的 数 做 加 1 计算 ， 最 终 得 到 : 11111010。 





由 于 二 进 制 补 码 的 表示 与 通常 我 们 可 和 直接 读 慌 的 二 进 制 数 的 表示 有 
很 大 不 同 ， 所 以 给 定 一 个 二 进 制 补 码 ， 我 们 往往 需要 先 获 得 其 绝对 值 大 
小 才能 知道 它 的 具体 数值 。 获 得 其 绝对 值 的 过 程 为 : 先 判 定 符号 位 ， 如 
果 符 写 位 为 0， 那 么 就 以 通常 的 二 进 制 数 表示 法 来 读 即 可 。 如 果 符号 位 
为 1， 那 么 就 以 上 述 同样 的 过 程 得 到 其 对 应 的 绝对 值 。 比 如 ， 如 果 给 定 
11111010 这 个 二 进 制 数 ， 我 们 看 到 最 高 位 符号 位 为 1， 说 明 是 负数 ， 我 
们 就 以 上 述 过 程 来 求解 : 











1) 先 将 该 二 进 制 数 每 个 比特 做 取 反 计算 ， 得 到 : 00000101; 


2) 然后 将 变换 得 到 的 值 做 加 1 计算 ， 最 终 获 得 : 00000110。 


所 以 11111010 的 绝对 值 为 00000110， 即 6。 


对 于 补 码 表示 ， 我 们 已 经 知道 最 高 位 比特 表示 符号 位 ， 其 余 的 表示 
具体 数值 。 但 是 这 里 有 一 个 特殊 情况 ， 即 符号 位 为 1， 其 余 位 比特 为 都 
为 0 的 情况 。 比 如 一 个 8 位 二 进 制 补 码 : 10000000， 此 时 它 的 值 是 多 少 ? 
因为 我 们 通过 上 述 流程 ， 求 得 其 绝对 值 的 大 小 也 是 10000000， 所 以 当前 
大 部 分 计算 机 处 理 器 的 实现 将 它 作 为 -128， 但 估计 仍然 有 一 些 处 理 器 会 


把 它 作 为 -0。 因 为 C 语 言 标准 中 对 于 数值 范围 的 表示 已 经 明确 表示 出 8 位 
带 符号 的 整数 范围 可 以 是 -128 到 +127， 也 可 以 是 -127 到 +127， 但 最 小 值 
不 得 大 于 -127， 最 大 值 不 得 小 于 +127。 第 5 章 会 有 更 详细 的 描述 。 








补 码 的 这 种 表示 法 的 优点 就 是 可 以 无 视 符 号 位 ， 随 意 进 行 算术 运算 
操作 。 比 如 ， 像 我 们 上 面 所 举 的 例子 : 6+〈-6) ， 计 算 结 有 果 : 


00000110+11111010=00000000 








最 后 ， 上 述 计算 结果 的 最 高 位 符号 位 所 产生 的 进位 被 丢弃 (在 处 理 
器 中 可 能 会 设置 相应 的 进位 标志 位 ) 。 我 们 自己 计算 的 话 也 非常 方便 ， 
在 计算 过 程 中 ， 无 需 关 心 两 个 二 进 制 补 码 的 正 负 数 的 情况 ， 也 无 需 关 心 
符号 位 所 产生 的 影响 。 我 们 只 需要 像 计 算 普 通 二 进 制 数 一 样 去 计算 即 
可 。 把 最 终 的 计算 结果 拿 出 来 判断， 是 正 数 还 是 负数 。 当 然 ， 二 进 制 补 
码 会 产生 洲 出 情况 ， 比 如 两 个 8 位 三 进 制 补 码 加 法 : 





120+50=01111000+00110010=10101010 


然而 ， 这 个 数 并 不 是 170， 而 是 -86。 首 先 ，170 已 经 超出 了 带 符号 8 
位 二 进 制 数 可 表示 的 最 大 范围 了 ; 其 次 ， 最 高 位 变 为 1， 用 补 码 表示 来 
讲 就 是 负数 表示 形式 。 所 以 ， 这 两 个 正 数 的 加 法 计算 就 产生 了 负数 结 
果 ， 这 种 现象 称 为 上 溢 。 如 果 我 们 要 避免 在 计算 过 程 中 出 现 上 溢 情 况 ， 
需要 用 更 高 位 宽 的 二 进 制 数 来 表示 ， 以 提升 精度 。 比 如 ， 如 果 我 们 将 上 
述 加 法 用 16 位 二 进 制 数 表 示 ， 那 么 就 不 会 有 上 淤 问题 了 。 


另外 ， 在 C 语 言 标准 中 没有 明确 规定 C 语 言 编译 器 的 实现 以 及 运行 
时 环境 必须 采用 哪 种 二 进 制 编码 方式 ， 而 是 对 整数 类 型 标明 最 大 可 表示 
的 数值 范围 。 目 前 大 部 分 C 语 言 实现 都 是 对 市 符号 整数 采用 补 码 的 表示 


方式 。 这 些 会 在 第 5 章 做 进一步 讲解 。 





2.2.3 ”八进制 数 与 十 六 进 制 数 


上 面 我 们 对 三 进 制 数 编码 形式 做 了 比较 详细 的 介绍 。 我 们 在 编写 程 
序 或 者 查看 一 些 计算 机 相关 的 技术 文档 时 利 第 还 会 碰 到 八进制 数 与 十 六 
进 制 数 的 表示 ， 无 其 是 十 六 进 制 数 用 得 非常 多 。 下 面 我 们 就 简单 介绍 一 
下 这 两 种 基数 (radixz) 的 表示 方法 。 








这 里 跟 各 位 再 分 享 一 个 术语 一 一 基数 。 基 数 也 就 是 我 们 通常 所 说 
的 ， 某 一 个 数 用 多 少 进 制 表达 。 对 于 像 *“01001000 是 几 进 制 数 " 这 种 话 ， 
如 果 用 更 专业 的 表达 方式 来 说 的 话 就 是 ,，“01001000 的 基数 是 几 ”。 基 数 
为 2 就 是 二 进 制 ， 基数 为 10 则 是 十 进 制 。 


八进制 数 是 逢 八 进 一 ， 因 此 每 位 数 的 范围 是 从 0 一 >。 八进制 数 转 十 
进 制 数 也 很 简单 ， 我 们 可 以 用 二 进 制 数 转 十 进 制 数 类 似 的 方法 来 炮制 人 
进 制 数 转 十 进 制 数 一 一 以 一 个 八进制 数 每 位 数值 作为 系数 ， 然 后 乘 以 
38?， 然 后 计算 得 到 的 结果 全 都 相 加 ， 最 后 得 到 相应 的 十 进 制 数 。 其 中 ， 
n 表 示 当 前 该 位 所 对 应 的 位 置 索引 《同样 以 0 开始 计 ) 。 比 如 ， 八 进 制 数 





5271 对 应 的 十 进 制 数 的 计算 过 程 如 图 2-5 所 示 。 


位 3 位 2 位 1 位 0 
83 82 8! 80 


最 终 十 进 制 数 的 结果 : 5 x 83+2 x 82+7 x 8I+1 x 8%+=2745 
图 2-5 “八进制 数 转 十 进 制 数 


八进制 数 对 应 于 二 进 制 数 的 话 正 好 占用 3 个 比特 《范围 从 000 一 
111) ， 一 般 在 通信 和 领域 以 及 信息 加 密 等 领域 会 用 到 八进制 编码 方式 。 
而 十 六 进 制 数 比 八 进 制 数 用 得 更 多 ， 因 为 十 六 进 制 数 正好 占用 4 个 比 
特 ， 即 4 位 二 进 制 数 〈 范 围 从 0000 一 1111) 。4 个 比特 相当 于 半 个 字 节 。 
所 以 ， 无 论 是 开发 工具 还 是 程序 调试 工具 ， 一 般 都 会 用 十 六 进 制 数 来 表 
示 计 算 机 内 部 的 二 进 制 数据 ， 这 样 更 易 读 ， 而 且 也 更 省 显示 空间 《因为 
一 个 字 市 原本 需要 8 位 二 进 制 数 ， 而 十 六 进 制 数 只 要 两 位 即 可 表示 )。 
下 面 殊 介绍 一 下 十 六 机 制 数 的 表示 方法 。 











十 六 进 制 数 逢 十 六 进 一 ， 因 此 每 一 位 数 的 范围 是 从 0 到 15。 由 于 我 
们 通 冲 在 数学 上 所 用 的 十 进 制 数 无 法 用 一 位 来 表示 10 一 15 这 6 个 数 ， 
而 在 计算 机 领域 中 ， 我 们 通常 用 英文 字母 A〈 或 小 写 a) 来 表示 10; 
B《〈 或 小 写 b) 来 表示 11; C 《或 小 写 c) 来 表示 12; D (或 小 写 d) 来 表 
示 13; EE 或 小 写 e) 来 表示 14; F 或 小 写 f) 来 表示 15。 十 六 机 制 数 转 


十 进 制 数 的 方式 与 八进制 数 转 十 进 制 数 类 似 一 一 以 一 个 十 六 进 制 数 每 位 
数值 作为 系数 ， 然 后 乘 以 16"， 然 后 计算 得 到 的 结果 全 都 相 加 ， 最 后 得 
到 相应 的 十 进 制 数 。 其 中 ，n 表 示 当 前 位 所 对 应 的 位 置 索引 《同样 以 0 开 
台 计 ) 。 比如， 一 个 4 位 十 六 进 制 数 CODE 的 计算 过 程 如 图 2-6 所 示 : 


位 3 位 2 位 1 位 0 
到 | 本 | 于 | 到 | 
163 16? 16! 160 


最 终 十 进 制 数 的 结果 : 12 x 163+0 x 162+13 x 161+14 x 16%+=49 374 
图 2-6 十 六 进 制 数 转 十 进 制 数 


上 述 4 位 十 六 进 制 数 CODE， 倘 若 用 三 进 制 数 表示 ， 则 为 : 
1100000011011110。 可 见 ， 用 十 六 进 制 数 表示 要 人 简洁 得 多 ， 而 且 换 算 成 
十 进 制 数 也 相对 比较 容易 ， 尤 其 对 于 一 个 字 节 长 度 的 整数 来 说 。 为 了 能 
更 快速 地 换算 二 进 制 数 、 十 进 制 数 与 十 六 进 制 数 ， 请 各 位 读者 务必 熟 记 
下 表 : 





表 2-1 二 进 制 数 、 十 进 制 数 与 十 六 进 制 数 的 换算 表 


= TA 


习惯 上 ， 用 0 或 0o0 打 头 的 数 表示 八进制 数 ，0x 打 头 的 数 表示 十 六 进 
制 数 。 比 如 ，0123、0777 表 示 八 进 制 数 ，0x123，0xABCD 表 示 十 六 进 
制 数 。 


2.3 ”浮上 扩 数 在 计算 机 中 的 表示 


当前 主流 处 理 器 一 般 都 能 支持 32 位 的 单 精度 浮 点 数 与 64 位 的 双 精 度 
浮 点 数 的 表示 和 计算 ， 并 且 能 遵循 IEEE754-1985 工 业 标 准 。 现 在 此 标准 
最 新 的 版 本 是 2008， 其 中 增加 了 对 16 位 半 精 度 浮 点 数 以 及 128 位 四 精度 
浮 点 数 的 描述 。C 语 言 标准 引入 了 一 个 浮 点 模型 ， 可 用 来 表达 任意 精度 
的 浮 点 数 ， 尽 管 当 前 主流 C 语 言 编译 器 尚未 很 好 地 支持 半 精 度 浮 点 数 与 
四 精度 浮 点 数 的 表示 和 计算 。 关 于 C 语 言 标 准 对 浮 点 数 的 描述 ， 我 们 稍 
后 将 在 5.2 节 做 更 详细 的 介绍 。 





为 了 更 好 地 理解 IEEE754-1985 中 规格 化 〈normalized) 浮 点 数 的 表 
示 法 ， 我 们 先 来 介绍 一 下 浮 点 数 用 一 般 二 进 制 数 的 表示 方法 。 一 个 浮 点 
数 包 含 了 整数 部 分 和 尾数 〈 即 小 数 ) 部 分 。 整 数 部 分 的 表示 与 我 们 之 前 
所 讨论 过 的 一 样 ， 第 n 位 就 表示 22，n 从 0 开始 计 。 而 尾数 部 分 则 是 第 m 位 
表示 2 也，m 从 1 开始 计 。 对 于 一 个 0101.1010 的 二 进 制 浮 点 数 对 应 十 进 制 
数 的 计算 如 图 2-7 所 示 : 

整 3 位 ” 整 2 位 整 1 位 ” 整 0 位 尾 1 位 ” 尾 2 位 ” 尾 3 位 。” 尾 4 位 

0 1 0 1 I 0 1 0 
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D3 ”2 7D1 ?0 全 二 9 二 2 
十 进 制 数 结果 为 : 
1x2"+0x2:+1x2+0x2+1Xx2+0x2-+1Xx2+0x2- =5.625 


图 2-7 ”二 进 制 浮 点 数 转 十 进 制 数 


图 2-7 中 ， 整 位 即 表 示 第 i 位 整数 ， 尾 i 位 即 表 示 第 i 位 尾数 。 其 中 ， 
第 3 位 整数 为 最 高 位 整数 ， 第 4 位 尾数 表示 最 低位 尾数 。 对 二 进 制 浮 点 数 
的 表示 有 了 概念 之 后 ， 我 们 就 可 以 看 IEEE754-1985 标 准 中 对 规格 化 浮 点 
数 的 描述 了 。IEEE754-1985 对 32 位 单 精 上 度 与 64 位 双 精 度 两 种 精度 的 浮 点 
数 进行 描述 。32 位 单 精度 浮 点 可 表示 的 数值 范围 在 +1.18x103 到 
+3.4x1038， 大 约 含 有 7 位 十 进 制 有 效 数 :64 位 双 精 度 浮 点 可 表示 的 数值 
范围 在 +2.23x10-308 到 +1.80x10308， 大 约 含 有 15 位 十 进 制 有 效 数 。 我 们 
看 到 IEEE 定 义 的 浮 点 数 的 绝对 值 范 围 可 以 是 一 个 远大 于 1 的 数 ， 也 可 以 
是 一 个 大 于 零 但 远 小 于 1 的 数 ， 即 它 的 小 数 精度 是 可 浮动 的 ， 所 以 称 之 
为 浮 点 数 。 如 果 说 是 定点 数 的 话 ， 它 也 可 表示 一 个 小 数 ， 但 是 其 整数 位 
数 与 小 数位 数 的 精度 都 是 固定 的 。 比 如 一 个 16.16 的 定点 数 表示 整数 部 
分 采用 16 个 比特 ， 尾 数 部 分 也 采用 16 个 比特 。 而 对 于 一 个 32 位 浮 点 数 来 
说 ， 既 能 使 用 16.16 的 格式 ， 也 能 使 用 30.2 的 格式 ( 即 30 个 比特 表示 整 
数 ，2 个 比特 表示 尾数 ) 或 其 他 各 种 形式 。 而 IEEE754-1985 对 规格 化 单 
精度 浮 点 数 的 格式 如 下 定义 : 











1) 1 位 符号 位 ， 一 般 是 最 高 位 〈31 位 ) ， 表 示 正 负 号 。0 表 示 正 
数 ，1 表 示人 负数 。 


2) 8 位 指数 位 ， 又 称 阶 码 ， 位 于 23 到 30 位 。〔 阶 码 的 计算 后 面 会 详 


细 介 绍 。) 


3) 23 位 尾数 ， 位 于 0 到 22 位 。 


我 们 下 面 举 一 个 实际 的 例子 来 详细 说 明 一 个 十 进 制 小 数 5.625 如 何 
表示 成 IEEE754 标 准 的 规格 化 32 位 单 精 度 浮 点 数 。 


1) 5.625 是 一 个 正 数 ， 所 以 符号 位 为 0， 即 第 31 位 为 0。 


2) 我 们 将 5.625 依 照 图 2-7 那 样 写 成 一 般 小 数 的 表示 法 
0101.101。 





3) 我 们 将 此 二 进 制 浮 点 数 用 科学 计数 法 来 表示 ， 使 得 二 进 制 整数 
位 为 最 高 位 的 1。 这 里 最 高 位 为 1 的 比特 是 从 左 往 右 数 是 第 二 个 比特 ， 所 
以 将 小 数 点 就 放 到 该 比特 的 后 面 ， 得 到 1.01101x2*。 二 进 制 数 的 科学 记 
数 法 ， 底 数 的 值 显然 就 是 2。 





4) 此 时 ， 我 们 能 看 到 尾数 部 分 是 小 数 点 后 面 的 那 串 二 进 制 数 ， 即 
01101， 而 指数 为 2。 现 在 我 们 来 求 阶 码 。 阶 码 用 的 是 中 经 指数 偏差 
(exponent bias〉 处 理 后 的 指数 ， 即 用 上 述 得 到 的 指数 加 上 偏差 值 所 求 
得 的 和 。IEEE754 在 单 精度 浮 点 中 规定 ， 偏 差 值 为 1227。 所 以 本 例 中 ， 阶 
码 部 分 为 2+127=129， 用 二 进 制 数 表示 就 是 10000001。 





5) 尾数 部 分 从 大 到 小 照抄 ， 低 位 的 用 0 填充 即 可 ， 所 以 这 里 的 尾数 
部 分 二 进 制 数 为 : 01101000000000000000000。 


6) 将 整个 处 理 完 的 二 进 制 数 串 起 来 获得 : 0〈 符 号 位 ) 
10000001《〈 阶 码 ) 01101000000000000000000 (尾数 ) ， 用 十 六 进 制 数 


表达 就 是 : 40B40000。 





十 进 制 小 数 转 64 位 双 精 度 浮 点 数 的 方法 与 上 述 雷 同 ， 只 不 过 阶 码 用 
11 位 比特 来 表示 ， 尾 数 则 用 52 位 比特 表示 ， 而 偏 莽 值 则 规定 为 1023。 





2.4 ”地 址 与 字 节 对 齐 





由 于 C 语 言 是 一 门 接近 底层 硬件 的 编程 语言 ， 它 能 直接 对 存储 露地 
址 进行 访问 《当前 大 部 分 处 理 器 在 操作 系统 的 应 用 层 所 访问 到 的 逻辑 地 
址 ， 而 部 分 嵌入 陈 系统 由 于 不 会 带 存 储 器 管理 单元 ， 因 此 可 直接 访问 物 
理 地 址 ) 。 在 计算 机 中 ， 上 所谓 “地 址 ?就 是 用 来 标识 存储 单元 的 一 个 编 
号 ， 就 好 比 我 们 住房 的 门牌 号 。 没 有 门牌 号 ， 快 递 就 没 法 发 货 ; 如 果 门 
牌号 记 错 了 ， 那 么 快递 就 会 把 货物 送 错 地 方 。 计 算 机 中 的 地 址 也 是 一 
样 ， 我 们 为 了 要 访问 存储 器 中 特定 单元 的 一 个 数据 ， 那 么 我 们 首先 要 获 
悉 该 数据 所 在 的 地 址 ， 然 后 我 们 通过 这 个 地 址 来 访问 它 。 访 问 存 储 器 ， 
我 们 也 简称 为 “ 访 存 ”(Memory Access) 。 访 问 地 址 ， 我 们 也 简称 为 寻 
址 ”〈Addressing) 。 我 们 在 图 2-1 中 也 看 到 ， 一 般 计 算 机 架构 中 都 会 有 
地 址 总 线 和 数据 总 线 。CPU 先 通过 地 址 总 线 发 送 寻 址 信号 ， 以 指定 所 要 
访问 存储 融 单 元 的 地 址 。 然 后 再 通过 数据 总 线 加 该 地 址 读 写 数据 ， 这 样 
就 完成 了 一 次 访 存 操作 。 这 好 比 于 快递 送 货 ， 我 们 先 打 电 话 告诉 快递 通 
信 地 址 ， 然 后 快递 员 把 货 送 到 该 地 址 〈 写 数据 ) ， 或 者 去 该 地 址 拿 货 
《读数 据 ) 送 到 别家 。 














一 般 对 于 32 位 系统 来 说 ， 处 理 器 一 次 可 访问 1 个 〈8 比 特 ) 字 节 、2 
个 字 市 或 4 个 字 节 。 当 访问 单个 字 节 时， 对 CPU 不 做 对 齐 限 制 ;， 而 当 访 
问 多 个 字 市 时 ， 比 如 要 访问 N 个 字 市 ， 由 于 计算 机 总 线 设 计 等 诸多 因 


素 ， 要 求 CPU 所 访问 的 起 始 地 址 满足 N 个 字 节 的 倍数 来 访问 存储 器 。 如 
果 在 访问 存储 器 时 没有 按照 特定 要 求 做 字 节 对 齐 ， 那 么 可 能 会 引发 访 存 
性 能 问题 ， 甚 至 直接 导致 寻 址 错误 而 引发 异常 〈 引 发 异常 后 通 疝 会 导致 
当前 应 用 意外 退出 ， 在 嵌入 式 系 统 中 可 能 就 直接 死机 或 复位 ) 。 











下 面 我 们 给 出 一 张 图 2-8 来 描述 ， 看 看 一 般 对 32 位 系统 而 言 如 何 正 
确 地 做 到 访 存 字 节 对 齐 。 





图 2-8 展 示 了 如 何 正确 对 齐 访 问 1 个 字 节 、2 个 字 节 和 4 个 字 节 的 情 
况 。 图 中 男 出 了 6 个 存储 单元 内 容 ， 地 址 低 16 位 从 0x1000 到 0x1005， 
个 存储 单元 为 1 个 字 节 。 对 于 仪 访问 1 个 字 节 的 情况 ， 图 2-8 所 有 地 址 都 
能 直接 访问 并 满足 字 节 对 齐 的 情况 。 对 于 一 次 访问 2 个 字 节 的 情况 ， 要 
满足 对 齐 要 求 ， 只 能 访问 0x1000、0x1002、0x1004 等 必须 要 能 被 2 整除 
的 地 址 。 对 于 一 次 访问 4 字 节 的 情况 ， 要 满足 对 齐 要求 ， 则 只 能 访问 
0x1000、0x1004 等 必须 要 能 被 4 整除 的 地 址 。 











| 个 字 节 








pe ye Ee 
5 字 和 4 字 委 。 守节 2 字 W1 字 Yo 
| 0x06 | 0x05 | 0x04 | Ox03 | 0x02 | 0x01 | 
0x1005 Ox1004 0x1003 0x1002 Ox1001 0x1000 ”地址 
2 个 字 季 


图 2-8 字 节 对 齐 





然而 ， 并 不 是 说 要 访问 多 少 字 节 ， 就 必须 要 保证 访问 能 被 多 少 整 除 
的 地 址 才能 满足 对 齐 要 求 。 如 果 一 次 访问 8 字 节 ， 对 于 32 位 系统 而 言 ， 

过 32 位 通用 目的 寄存 器 来 读 写 存储 融 的 话 ， 东 些 CPU 会 目 动 将 8 字 
的 访 存 分 为 两 次 进行 操作 ， 每 次 为 4 守节， 因此 只 要 保证 4 字 节 对 齐 就 能 
满足 对 齐 要 求 。 这 些 部 根据 特定 的 处 理 器 来 做 具体 处 理 。 








就 笔者 用 过 的 一 些 处 理 器 而 言 ， 像 x86、ARM 等 处 理 器 ， 当 访 存 不 
满足 对 齐 要 求 时 并 不 会 引发 总 线 异 常 ， 但 是 访问 性 能 会 降低 很 多 。 因 为 
原本 可 一 次 通信 的 数据 传输 可 能 需要 拆 分 为 多 次 ， 并 且 前 后 还 要 保证 数 
据 的 一 致 性 ， 所 以 还 可 能 会 有 锁 步 之 类 的 操作 。 而 像 Blackfin DSP 则 会 
直接 引发 总 线 异 常 ， 导 致 整个 系统 的 骨 泪 《如果 不对 此 异常 做 处 理 的 
话 ) 。 另 外 ， 像 ARMV5 或 更 低 版 本 的 处 理 器 ， 在 对 非 对 齐 的 存储 器 地 
址 进行 访问 时 ，CPU 会 先 自动 向 下 定位 到 对 齐 地 址 ， 然 后 通过 向 右 循环 
移 位 的 方式 处 理 数 据 ， 这 就 使 得 传输 数据 并 不 是 原本 想 一 次 传输 的 数据 
内 容 ， 也 就 是 说 写 入 的 或 读 出 的 数据 是 失真 的 。 比 如 ， 根 据 图 2-8 所 示 
内 容 ， 如 果 我 们 要 对 一 款 ARM7EJ-S 处 理 器 (ARMYVv5TEJ 架 构 ) 从 地 址 
0x1002 读 4 字 节 内 容 ， 那 么 实际 获取 到 的 数据 为 0x02010403; 而 在 x86 架 
构 或 ARMv7 架 构 的 处 理 器 下 ， 则 能 获得 0x06050403。 











2.5 字符 编码 


我 们 从 2.2 节 到 2.4 节 讲述 的 都 是 数值 信息 (整数 与 浮 点 数 ) ， 本 小 
节 我 们 将 讨论 字符 信息 。 在 计算 机 中 我 们 所 处 理 的 字符 信息 ， 即 文本 信 
恩 〈 包 括 数 字 、 字 母 、 文 字 、 标 点 符号 等 ) 是 以 一 种 特定 编码 格式 来 定 
义 的 。 为 了 使 世界 各 国 的 文本 信息 能 够 通用 ， 就 需要 对 字符 编码 做 标准 
化 。 我 们 现在 最 常用 也 最 基本 的 字符 编码 系统 是 ASCI 码 (American 
Standard Code for Information Interchange， 美 国信 息 交 换 标准 码 ) 。 
ASCII 码 定义 每 个 字符 仅 占 一 个 字 节 ， 可 表示 阿拉 伯 数 字 0 一 9、26 个 大 
小 写 英文 字母 ， 以 及 我 们 现在 在 标准 键盘 上 能 看 到 的 所 有 标点 符号 、 一 
些 控 制 字符 《比如 换行 、 回 车 、 换 页 、 振 铃 等 ) 。ASCII 码 最 高 位 是 奇 
偶 校 验 位 ， 用 于 通信 校 验 ， 所 以 真正 有 编码 意义 的 是 低 7 个 比特 ， 因 此 
只 能 用 于 表示 128 个 字符 〈 值 从 0 一 127) 。 由 于 ASCII 是 美国 国家 标准 ， 
所 以 后 来 国际 化 标准 组 织 将 它 进行 国际 标准 化 ， 定 义 为 了 ISOVIEC 646 
标准 。 两 者 所 定义 的 内 容 是 等 价 的 。 





























ISO/IEC 646 对 于 英文 系 国 家 而 言 是 基本 够 用 了 ， 但 是 对 于 拉丁 语 
系 、 和 希腊 等 国家 来 说 就 不 够 用 了 。 所 以 后 来 ISO 组 织 就 把 原先 ISOVIEC 
646 所 定义 字符 的 最 高 位 也 用 上 了 ， 这 样 就 又 能 增加 128 个 不 同 的 字符 ， 
发 布 了 ISO/TEC 8859 标 准 。 然 而 ， 欧 洲 大 陆 虽 小 ， 但 国家 却 有 数 百 个 ， 
128 种 扩展 字符 仍然 不 够 用 。 因 此 后 来 就 在 8859 的 基础 上 ， 引 入 了 8859- 


n，n 从 1 一 16， 每 一 种 都 支持 了 一 定数 量 的 不 同 的 字母 ， 这 样 基本 能 满 
足 欧美 国家 的 文字 表示 需求 。 当 然 ， 有 些 国家 之 间 仍 然 需 要 切换 编码 格 
式 ， 比 如 ISO/IEC8859-1 的 语言 环境 看 8859-2 的 就 可 能 显示 乱码 ， 所 以 ， 
还 得 切换 到 8859-2 的 字符 编码 格式 下 才能 正常 显示 。 








而 在 中 国 大 陆 ， 我 们 自己 也 定义 了 一 套用 于 显示 简体 中 文 的 字符 集 
一 一 GB2312。 它 在 1981 年 5 月 1 日 开始 实施 ， 是 中 国 国 家 标准 的 简体 中 
文字 符 集 ， 人 全称 为 《信息 交换 用 汉字 编码 字符 集 - 基 本 集 》。 它 收录 了 
6763 个 汉字 ， 包 括 拉 丁字 母 、 和 希腊 字母 、 日 语 假名 、 俄 语 和 蒙古 语 用 的 
西里 尔 字 母 在 内 的 682 个 全 角 字 符 。 然 后 又 出 现 了 GBK 字 符 集 ，GBK1.0 
收录 了 21886 个 符号 ， 其 中 汉字 就 包含 了 21003 个 。GBK 字 符 集 主要 扩展 
了 繁体 中 文字 。 由 于 像 GB2312 与 GBK 能 表示 成 千 上 万 种 字符 ， 因 此 这 
己 经 远 超 1 个 字 节 所 能 表示 的 范围 。 它 们 所 采用 的 是 动态 变 长 字 节 编 
码 ， 并 且 与 ASCII 码 兼容 。 如 果 表 示 ASCII 码 部 分 ， 那 么 仅 1 个 字 节 即 
可 ， 并 且 该 字 节 最 高 位 为 0。 如 果 要 表示 汉字 等 扩展 字符 ， 那 么 头 1 个 字 
节 的 最 高 位 为 1， 然 后 再 增加 一 个 字 节 《 即 用 两 个 字 节 ) 进行 表示 。 所 
以 ， 理 论 上 ， 除 了 第 1 个 字 节 的 最 高 位 不 能 动 之 外 ， 其 余 比 特 都 能 表示 
具体 的 字符 信息 ， 因 而 最 多 可 表示 2’+21?=32896 种 字符 。 























当然 ， 正 由 于 GB2312 与 GBK 主 要 用 于 亚洲 国家 ， 所 以 当 欧 美国 家 
的 人 看 到 这 些 字符 信息 时 显示 的 是 乱码 ， 他 们 必须 切换 到 相应 的 汉字 编 
码 环境 下 看 才能 看 到 正确 的 文本 信息 。 为 了 能 真正 将 全 球 各 国语 言 进 行 














互 换 通信 ， 出 现 了 Unicode (Universal Character Set，UCS) 标准 。 它 对 
应 于 编码 标准 ISO/IEC 10646。Unicode 前 后 也 出 现 了 多 个 版 本 。 早 先 的 
UCS-2 采 用 固定 的 双 字 节 编 码 方式 ， 理 论 上 可 表示 21%=65536 种 字符 ， 
此 极 大 地 涵 羡 了 各 种 语言 的 文字 符号 。 





不 过 后 来 ， 标 准 委员 会 意识 到 ， 对 于 像 希 们 来 字母 、 拉 丁字 母 等 压 
根 就 不 需要 用 两 个 字 贡 表示， 而且 定 长 的 双 字 节 表 示 与 原 有 的 ASCII 码 
又 不 兼容 ， 因 此 后 来 出 现 了 现在 用 得 更 多 的 UTF-8 编 码 标 准 。UTF-8 属 
于 变 长 的 编码 方式 ， 它 最 少 可 用 1 个 字 节 表示 1 个 字符 ， 最 多 用 4 个 字 市 
表示 1 个 字符 ， 判 别 依据 就 是 看 第 1 个 字 节 的 最 高 位 有 多 少 个 1。 如 采 第 1 


个 字 节 的 最 高 位 是 9， 那 么 该 字符 用 1 个 字 节 表示 最 高 3 位 是 110， 那 么 
























































用 2 个 字 节 表示 ; 最 高 4 位 是 1110， 那 么 用 3 个 字 节 表示 ; 最 高 位 是 

11110， 那 么 该 字符 由 4 个 字 节 来 表示 。 所 以 UTF-8 现 在 大 量 用 于 网 络 通 
信 的 字符 编码 格式 ， 包 括 大 多 数 网 页 用 的 默认 字符 编码 也 都 是 UTF-8 编 
码 。 尽 管 UTF-8 更 为 灵活 ， 而 且 也 与 ASCII 码 完全 兼容 ， 但 不 利于 程序 
解析 。 所 以 现在 很 多 编程 语言 的 编译 器 以 及 运行 时 库 用 得 更 多 的 是 

UTF-16 编 码 来 处 理 源 代码 解析 以 及 各 类 文本 解析 ， 它 与 之 前 的 UCS-2 编 
码 完 全 兼容 ， 但 也 是 变 长 编码 方式 ， 可 用 双 字 节 或 四 字 节 来 表示 一 个 字 
符 。 如 果 用 双 字 节 表 示 UTF-16 编 码 的 话 ， 范 围 从 0x0000 到 0xD7FF， 以 
及 从 0xE000 到 0xFFFF。 这 里 留 出 0xD800 到 0xDFFF， 不 作为 具体 字符 的 
编码 表示 ， 而 是 用 于 四 字 节 编码 时 的 编码 替换 。 当 UTF-16 表 示 0x10000 
到 0x10FFFF 之 间 的 字符 时 ， 先 将 该 范围 内 的 值 减 去 0x10000， 使 得 结果 



































沙 在 0x00000 到 0xFFFFF 范 围 内 。 然 后 将 结果 划分 为 高 10 位 与 低 10 位 两 
组 。 将 低 10 位 的 值 与 xDC00 相 加 ， 获 得 低 16 位 ;高 10 位 与 0xD800 相 
加 ， 获 得 高 16 位 。 比 如 ， 一 个 Unicode 定 义 的 码 点 (code point) 为 
0x10437 的 字符 ， 用 UTF-16 编 码 表示 的 步骤 如 下 。 








1) 先 将 它 减 去 0x10000 0x10437-0x10000=0x0437。 


2) 将 该 结果 分 为 低 10 位 与 高 10 位 ，0x0437 用 20 位 二 进 制 表示 为 
00000000010000110111， 因 此 高 10 位 是 0000000001=0x01; 低 10 位 则 是 
0000110111， 即 0x037。 


3) 将 高 10 位 与 0xD800 相 加 ， 得 到 0xD801; 将 低 10 位 与 0xDC00 相 
加 ， 获 得 0xDC37。 因 此 最 终 UTF-16 编 码 为 0xD801DC37。 








我 们 看 到 ， 尽 管 UTF-16 也 是 变 长 编码 表示 ， 但 是 仅 低 16 位 就 能 
示 很 多 字符 符号 ， 况 且 即 便 要 表示 更 广 范围 的 字符 ， 也 只 是 第 二 种 四 字 
节 的 表示 方法 ， 这 远 比 UTF-8 四 种 不 同 的 编码 方式 要 简洁 很 多 。 因 此 ， 
UTF-16 用 在 很 多 编程 语言 运行 时 系统 字符 编码 的 场合 比较 多 。 像 现在 
的 Java、Objective-C 等 编程 语言 环境 内 部 系统 所 表示 的 字符 都 是 UTF-16 
编码 方式 。 








另外 ， 现 在 还 有 UTEF-32 编 码 方 式 ， 这 一 开始 也 是 Unicode 标 准 搞 出 
来 的 UCS-4 标 准 ， 它 与 UCS-2 一 样 ， 是 定 长 编码 方式 ， 但 每 个 字符 用 固 
定 的 4 字 节 来 表示 。 不 过 现在 此 格式 用 得 很 少 ， 而 且 HTML5 标 准 组 织 也 





公开 声明 开发 者 应 当 尽 量 避 免 在 页 面 中 使 用 UTF-32 编 码 格 式 ， 因 为 在 
HTML5 规 范 中 所 描述 的 编码 侦 测算 法 ， 故 意 不 对 它 与 UTF-16 编 码 做 区 


分 。 


2.6 ”大 端 与 小 端 


现代 计算 机 系统 中 含有 两 种 存放 数据 的 字 节 序 ， 大 端 (Big- 
endian) 和 小 端 《〈Little-endian) 。 上 所谓 大 端 字 贡 序 是 指 在 读 写 一 个 大 于 
1 个 字 节 的 数据 时 ， 其 数据 的 最 高 字 节 存放 在 起 始 地 址 单元 处 ， 数 据 的 
最 低 字 节 存 放 在 最 高 地 址 单元 处 。 所 谓 小 端 字 节 序 是 指 在 读 写 一 个 大 于 
1 个 字 节 的 数据 时 ， 其 数据 的 最 低 字 节 存放 在 起 始 地 址 单元 处 ， 而 数据 
的 最 高 字 节 存放 在 最 高 地 址 单元 处 。 比 如 ， 我 们 要 在 地 址 0x00001000 处 
存放 一 个 0x04030201 的 32 位 整数 ， 其 大 端 、 小 站 存放 情况 如 图 2-9 所 


人 钞 。 


大 端 字 节 序 | 0x04 0x02 0x01 


地 址 UxX1000 “0xl001 0x1002 UX1003 


小 闹 字 闻 序 | 0x01 0x02 Ox03 Ox04 


图 2-9 大 端 与 小 端 



































当前 ， 通 用 蝎 面 处 理 器 以 及 智能 移动 设备 的 处 理 器 一 般 都 用 小 端 字 
节 序 。 通 信 设 备 中 用 大 端 字 节 订 比较 普 授 。 





本 书后 续 所 要 叙述 的 内 容 中 ， 知 无 特殊 说 明 ， 都 是 基于 小 端 字 布 序 
进行 描述 。 


2.7” 按 位 逻辑 运算 


按 位 逻辑 运算 在 计算 机 编程 中 会 经 常 涉及 ， 这 些 运 算 都 是 针对 二 进 
制 比特 进行 操作 的 。 所 谓 的 “ 按 位 ?计算 就 是 指 对 一 组 数据 的 每 个 比特 逐 
位 进行 计算 ， 并 且 对 每 个 比特 的 计算 结果 不 会 影响 其 他 位 。 和 营 用 的 按 位 
逻辑 运算 包括 “ 按 位 与 "、“ 按 位 或 、“ 按 位 异 或 ”以 及 “ 按 位 取 反 ”四 种 。 


下 面 将 分 别 介绍 这 4 种 运算 方式 。 








1) 按 位 与 : 它 是 一 个 双 目 操作 ， 需 要 两 个 操作 数 ， 在 C 语 言 中 用 & 
表示 。 两 个 比特 的 按 位 与 结果 如 下 : 


0&0=0; 0&1=0; 1&0=0; 1&1=1 


也 就 是 说 ， 两 个 比特 中 如 果 有 一 个 比特 是 9， 那么 按 位 与 的 结果 就 
是 0， 只 有 当 两 个 比特 都 为 1 的 时 候 ， 按 位 与 的 结果 才 为 1。 比 如 ， 对 两 
个 字 节 01001010 和 11110011 进 行 按 位 与 的 结果 为 01000010。 按 位 与 一 般 
可 用 于 判定 某 个 标志 位 是 否 被 设置 。 比 如 ， 我 们 假定 处 理 一 个 游戏 手柄 
的 按键 事件 ， 用 一 个 字 节 来 存放 按键 被 按 下 的 标志 ， 前 4 个 比特 分 别 表 
示 “ 上 ”“ 下 ”、“ 左 ”、“ 右 *"。 比 特 4 表 示 按 下 了 “A” 键 ， 比 特 5 表 示 按 下 
了 “B” 键 ， 比 特 6 表 示 按 下 了 “X” 键 ， 比 特 7 表示 按 下 了 “Y” 键 。 那 么 当 我 
们 接收 到 三 进 制 数 01010100 时 ， 说 明 用 户 同时 按 下 了 “ 左 * 方 向 
键 、“A” 键 和 “X” 键 。 那 么 我 们 判定 按键 标志 时 可 以 通过 按 位 与 二 进 制 








数 1 来 判定 是 否 按 下 了 “上 ” 键 ， 按 位 与 二 进 制 数 10 做 按 位 与 操作 来 判定 
古 否 按 下 了 “下 ” 键 ， 跟 二 进 制 数 100 做 与 操作 来 判定 是 否 按 下 

了 “ 左 ” 键 ， 以 此 类 推 。 如果 按 位 与 的 结果 是 0， 说 明 当 前 此 按键 没有 被 
按 下 ， 如 果 结 果 不 为 零 ， 说 明 此 按键 被 按 下 。 











2) 投 位 或 : 它 是 一 个 双 目 操作 符 ， 需 要 两 个 操作 数 ， 在 C 语 言 中 
用 “表示 。 两 个 比特 的 按 位 或 结果 如 下 : 


0I0=0; 0l1=1; 1|0=1; 1|1=1 





也 就 是 说 ， 只 要 有 一 个 比特 的 值 是 1， 那 么 按 位 或 的 结果 就 是 1， 只 
有 当 两 个 比特 的 值 都 为 0 的 时 候 ， 按 位 或 的 结果 才 是 0。 比 如 ， 对 于 两 个 
字 节 01001010 和 11110011 进 行 按 位 或 的 结果 为 11111011。 按 位 或 一 般 可 
用 于 设置 标志 位 。 就 如 同上 述 例子 ， 如 果 用 户 按 下 了 “上 ? 键 ， 那 么 系统 
底层 会 将 最 低位 设置 为 1， 如 果 用 户 按 下 了 “Y” 键 ， 那 么 系统 底层 会 将 最 
高 位 设置 为 1。 随 后 系统 会 将 这 串 信息 发 送 到 应 用 UI 层 。 








3) 按 位 开 或 : 它 是 一 个 双 目 操作 ， 需 要 两 个 操作 数 ， 在 C 语 言 中 用 
人 ^ 表 示 。 两 个 比特 的 按 位 寞 或 结果 如 下 


0^0=0; ”0 和 1=1; 1 和 0=1; 1^1=0 


也 就 是 说 ， 如 果 两 个 比特 的 值 相 同 ， 那 么 按 位 异 或 的 结果 为 0， 不 
同 为 1。 比 如 ， 对 于 两 个 字 节 01001010 和 11110011 进 行 按 位 或 的 结果 为 


10111001。 按 位 异 或 适用 于 多 种 场景 ， 比 如 我 们 用 一 个 输入 比特 与 1 进 
行 民 或 加 可 以 反 转 该 输入 比特 的 值 ， 输 入 为 0， 那 么 结果 为 1; 输入 为 
1， 那 么 结果 为 0。 任 一 比特 与 0 异 或 ， 那 么 结果 还 是 原 比 特 的 值 。 按 位 
异 或 跟 按 位 与 和 按 位 或 不 同 ， 它 可 以 对 数据 信息 进行 全 加 组 合 。 因 为 给 
定 任 一 比特 ， 对 于 为 外 一 个 比特 的 输入 ， 不 同 的 输入 值 对 应 不 同 的 输 
出 ， 所 以 我 们 通过 异 或 能 还 原 信息 。 比 如 ,我们 有 两 个 整数 a 和 b， 我 们 
设 c=a^b。 对 于 c， 我 们 可 以 通过 cha 重新 得 到 b， 也 可 以 通过 cAb 来 重新 得 
到 a。 所 以 寞 或 在 信息 编码 、 数 据 加 密 等 技术 上 应 用 得 非常 多 。 











4) 按 位 取 反 : 它 是 一 个 单 目 操作 ， 只 需要 一 个 操作 数 ， 在 C 语 言 中 
用 ~ 表示 。 一 个 比特 的 按 位 取 反 结果 如 下 : ~0=1; ~1=0。 比 如 ， 对 一 个 
字 节 01001010 进 行 按 位 取 反 的 结果 为 10110101。 


2.8 移 位 操作 


现代 处 理 咒 的 计算 单元 中 一 般 都 会 包含 移 位 器 。 移 位 器 往往 能 执行 
算术 左 移 (Arithmetic Shift Left) 、 算 术 右 移 〈Arithmetic Shift 
Right) 、 逻 辑 左 移 (Logical Shift Left) 、 逻 辑 右 移 (Logical Shift 
Right) 、 循 环 右 移 〈Rotational Shift Right) 这 些 操作 。 


下 面 我 们 将 分 别 介绍 这 些 移 位 操作 ， 这 里 需要 提醒 各 位 的 是 ， 移 位 
操作 一 般 总 是 对 整数 数据 进行 操作 ， 并 且 移 入 移出 的 都 是 二 进 制 比特 。 
然而 ， 不 同 的 处 理 器 架构 对 移 位 操作 的 实现 可 能 会 有 一 些 不 同 。 比 如 ， 
如 果 对 一 个 32 位 寄存 器 做 移 位 操作 ， 倘 大 指定 要 移动 的 比特 数 超过 了 
31， 那 么 在 x86 处 理 器 中 是 将 指定 的 比特 移动 位 数 做 模 32 处 理 〈 也 就 是 
求 除 以 32 的 余数 ， 比 如 左 移 32 位 相当 于 左 移 0 位 、 右 移 33 位 相当 于 右 移 1 
位 〉; 而 在 ARM、AVR 等 处 理 嚣 中， 对 一 个 32 位 的 整数 做 左 移 和 人 逻辑 
右 移 超出 31 位 的 结果 都 将 是 零 。 








2.8.1 算术 左 移 与 逻辑 左 移 





由 于 算术 左 移 与 逻辑 左 移 操作 基本 是 相同 的 ， 仪 仪 对 标志 位 的 影响 
有 些 区 别 ， 所 以 合并 在 一 起 讲 。 左 移 的 操作 步 又 十 分 简单 ， 假 设 我 们 要 
左 移 N 人 位， 那么 先 将 整数 的 每 个 比特 疝 左 移动 N 人 位， 然后 空 出 的 低 N 位 填 








零 。 图 2-10 展 示 了 对 一 个 8 位 整数 分 别 做 左 移 1 位 与 左 移 2 位 的 过 程 。 





图 2-10 算术 左 移 与 逻辑 左 移 


图 2-10 中 间 由 小 写字 母 a 一 h 构 成 的 方 格 图 即 表 示 一 个 8 位 二 进 制 整 
数 ， 每 个 小 写字 母 表 示 一 比特 ， 并 且 字 母 a 作 为 最 高 位 比特 ， 字 母 h 作 为 
最 低位 比特 。 堪 移 1 位 后 ， 原 来 的 8 位 二 进 制 数 就 变 成 了 bcdefgh0; 左 移 
2 位 后 ， 原 来 的 8 位 二 进 制 数 束 变 成 了 cdefgh00。 





2.8.2 ”逻辑 右 移 


逻辑 右 移 的 操作 步 厅 是 : 先 将 整数 的 每 一 个 比特 问 右 移 动 N 位 ， 然 
后 高 N 位 用 零 来 填补 。 图 2-11 展 示 了 一 个 8 位 二 进 制 整 数 分 别 迎 辑 右 移 1 


位 和 2 位 的 过 程 。 

















图 2-11 逻辑 右 移 


图 2-11 中 间 由 小 写字 母 a~h 构 成 的 方 格 图 即 表 示 一 个 8 位 三 进 制 整 
数 ， 每 个 小 写字 母 表示 一 位 比特 ， 并 且 字 母 a 作 为 最 高 位 比特 ， 字 母 h 作 
为 最 低位 比特 。 将 原始 二 进 制 8 位 数据 逻辑 右 移 1 位 后 ， 二 进 制 数据 变 为 
0abcdefg; 还 辑 右 移 2 位 后 ， 二 进 制 数 据 变 为 00abcdef 。 











2.8.3 ”算术 右 移 





算术 右 移 与 逻辑 右 移 类 似 ， 只 不 过 移出 N 位 之 后 ， 高 N 位 不 是 用 零 
来 填充 ， 而 是 根据 原始 整数 的 最 高 位 ， 如 果 原 始 整数 的 最 高 位 为 1， 那 
么 移 位 后 的 高 N 位 用 1 来 填充 ， 如 果 是 0， 则 用 0 来 填充 。 图 2-12 展 示 了 一 
个 8 位 二 进 制 整数 分 别 算术 右 移 1 位 和 2 位 的 过 程 。 














图 2-12 ”算术 右 移 


图 2-12 中 间 由 小 写字 母 a~h 构 成 的 方 格 图 ， 即 表示 一 个 8 位 二 进 制 
整数 ， 每 个 小 写字 母 表示 一 位 比特 ， 并 且 字 母 a 作 为 最 高 位 比特 ， 字 母 h 
作为 最 低位 比特 。 将 原始 8 位 二 进 制 整数 算术 右 移 1 位 之 后 ， 该 二 进 制 数 
变 为 aabcdefg; 将 它 算 术 右 移 2 位 之 后 ， 变 为 aaabcdef 。 














2.8.4 循环 右 移 


循环 右 移 的 步 序 是 : 先 将 原始 二 进 制 整 数 右 移 N 位 ， 移 出 的 N 位 依 
次 放 入 到 高 N 位 。 图 2-13 展 示 了 将 一 个 8 位 二 进 制 整数 分 别 循环 右 移 1 位 
和 2 位 的 过 程 。 





图 2-13 ”循环 右 移 


图 2-13 中 间 由 小 写字 母 a~h 构 成 的 方 格 图 ， 即 表示 一 个 8 位 二 进 制 
整数 ， 每 个 小 写字 母 表 示 一 位 比特 ， 并 且 字 母 a 作 为 最 高 位 比特 ， 字 母 h 
作为 最 低位 比特 。 将 原始 8 位 二 进 制 整数 循环 右 移 1 位 之 后 ， 该 二 进 制 整 
数 变 为 habcdefg; 将 它 循环 右 移 2 位 之 后 ， 该 二 进 制 整数 变 为 ghabcdef。 











2.9 本 章 小 结 


本 章 大 致 介绍 了 计算 机 体系 结构 以 及 程序 执行 的 大 致 流程 ， 然 后 描 
述 了 整数 以 及 浮 后 数 在 计算 机 中 的 存储 方式 ， 之 后 还 介绍 了 地 址 与 字 市 
对 齐 、 字 符 编码 、 处 理 器 大 端 与 小 端 字 市 序 ， 以 及 按 位 逻辑 运算 和 移 位 
操作 。 由 于 这 些 知识 部 是 学 习 C 语 言 必 备 的 ，C 语 言 中 有 相关 语法 与 这 
些 概念 对 应 ， 所 以 各 位 最 好 能 先 理解 、 掌 握 这 些 基 本 知识 ， 这 样 对 后 续 
学 习 C 语 言 将 有 很 大 帮助 。 








第 3 草 ”C 语 言 编 程 的 环境 挫 建 


我 们 在 第 2 章 讲 述 了 学 习 C 语 言 所 必需 的 一 些 预备 知识 。 本 章 将 给 
家 介绍 凋 用 果 面 操作 系统 下 的 C 语 言 环 境 搭建 。 这 里 所 讲述 的 C 语 言 编 
译名 以 及 集成 开发 环境 〈IDE) 都 是 可 合法 免费 下 载 的 ， 本 书 不 或 励 各 
位 使 用 盗版 或 破解 软件 ， 所 以 下 面 会 列 出 下 载 这 些 合法 免费 软件 的 官方 
链接 ， 大 家 把 编程 环境 搭建 完 之 后 即 可 上 机 实践 编程 。 


3.1 Windows 操 作 系 统 下 搭建 C 语 言 编 程 环 境 


Windows 操 作 系 统 下 默认 不 自 带 任何 C 语 言 编译 器 ， 大 家 必须 从 网 

上 下 载 自 己 所 需要 的 C 语 言 编译 器 。 如 果 各 位 想 通过 C 语 言 开 发 Windows 
系统 平台 相关 的 应 用 ， 或 者 主要 想 在 Windows 平 台 对 C 语 言 程 序 进行 调 
试 ， 那 么 往往 首选 Visual Studio Community。 这 款 开 发 环境 是 免费 的 ， 
里 面 自 带 了 微软 自家 的 C 语 言 编 译 器 一 一 简称 为 MSVC。 不 过 当前 
MSVC 无 法 文 持 最 新 的 C11 标 准 新 特性 ， 而 且 即 便 是 C99 标 准 也 是 文 持 得 
比较 有 限 ， 所 以 它 并 不 适合 学 习 C11 最 新 标准 。 但 对 于 C 语 言 初学 者 而 
言 ， 这 款 集 成 开发 环境 还 是 非常 适合 的 。 幸 运 的 是 ，2017 年 3 月 微软 最 
新 推出 的 Visual Studio Community 2017 包 含 了 Clang 编 译 器 前 端 工 具 ， 如 
果 我 们 匀 选 安装 的 话 即 可 使 用 Clang 来 作为 C 语 言 编译 器 。 尽 管 Visual 
Studio 下 的 Clang 编 译 器 尚 处 于 试验 阶段 ， 但 大 部 分 功能 都 可 用 了 。 目 前 

笔者 测试 下 来 ， 它 对 原子 操作 还 没 文 持 好 ， 另 外 像 UTF-8、UTF-16 等 字 

符 编码 问题 还 与 Windows 操 作 系 统 本 身 相 关 ， 所 以 要 涉及 这 些 问题 的 
话 ， 我 们 只 能 使 用 系统 特定 的 接口 去 解决 或 者 使 用 下 面 提 到 的 MinGW 
以 及 Clang 官 方 提供 的 编译 工具 链 去 解决 。 




















所 以 ， 如 果 大 家 想 在 Windows 操 作 系 统 下 学 习 更 为 完整 的 C11 标 准 
最 新 特性 ， 那 么 建议 下 载 MinGW， 如 果 是 64 位 的 Windows 系 统 的 话 则 最 
好 下 载 Mingw-w64。 如 果 还 想 学 习 Clang 编 译 器 语法 扩展 的 话 ， 也 可 以 


再 下 载 单独 的 Clang 编 译 器 。 
3.1.1 安装 Visual Studio Community 2017 


Visual Studio Community 最 新 版 本 可 在 微软 的 Visual Studio 官 方 网 站 
下 载 : 


https://www.visualstudio.com/thank-you-downloading-visual-studio/? 


sku=Community&rel=15。 


当 我 们 下 载 好 Visual Studio Community 的 安装 程序 之 后 ， 将 它 打 开 
运行 。 随 后 会 看 到 一 个 选择 安装 组 件 的 对 话 框 。 我 们 在 该 对 话 框 的 右 侧 
能 看 到 已 经 勾 选 上 的 组 件 以 及 一 些 没有 勾 选 上 的 组 件 。 这 里 我 们 必须 勾 
选 上 “Clang/C2〔 实 验 ) ”这 一 项 ， 如 图 3-1 所 示 。 因 为 不 安装 Clang， 后 
面 就 无 法 用 它 编译 C 源 代码 。 


可 寺 


VC++ 2017 v141 工 且 集 {x86.x64 
C++ 分 析 工 具 

Windows 10 SDK (10.0.14393.0) 

用 于 CMake 的 Visual C++ 工 且 

Visual C++ ATL 支持 

Windows 8.1 SDK 和 UCRT SDK 

[| 对 C++ 的 Windows XP 支持 

口 MFC 和 ATL A 和 x64) 


Clang/C2 i 

| 标准 库 模 块 

| ] IncrediBuild 

|] Windows 10 SDK (10.0.10586.0) 





图 3-1 Visual Studio Community 安 装 界 面 


安装 完成 之 后 ， 我 们 打开 Visual Studio Community 2017， 首 先 出 现 
欢迎 界面 。Visual Studio 在 首次 局 动 时 就 会 很 明显 地 提示 我 们 注册 账号 
或 用 账号 登录 。 我 们 先 用 Hotmail 或 MSN 账 号 登录 注册 ， 如 果 不 注 册 仅 
有 30 天 左右 的 试用 时 间 ， 但 一 旦 注册 完 之 后 就 能 永久 使 用 了 。 我 们 登录 
完 自己 的 账号 之 后 就 可 以 开始 新 建 一 个 C 语 言 的 项 目 工程 了 。 








我 们 找到 菜单 栏 最 左边 的 “文件 ”， 然 后 选择 “新 建 >， 再 点 击 “ 项 
”如 图 3-2 所 示 。 


说 ”项目 (P).. 


羯 ”网 站 (W).. 
和 文件 (P)- 
从 现 有 代码 创建 项 目 (E)…. 





图 3-2 ”欢迎 界面 中 新 建 项 目 


随后 我 们 会 看 到 新 建 项 目的 对 话 框 。 在 左 侧 边 栏 中 找到 “Visual 
C++”， 然 后 选中 “Win32”， 随 后 在 中 间 栏 选择 “Win32 Console 
Application”， 最 后 ， 在 底下 输入 此 工程 创建 后 存放 的 目录 路 径 以 及 工程 
名 ， 如 图 3-3 所 示 。 


SortbylDefovt | 全 加 


国 wnaz console Appiication 


Search Installed Templates (Ctrl+E) fP ~ 


Type: Visual C++ 
二 本 
Win32 project 


A project for creating a Win32 console 
application 


Visual Studio Solutions 
Samples 
b Online 


Click here to go online and find template: 
C:\vc_programs\ 3 
demo I 
图 





图 3-3 ”Visual Sutdio 新 建 项 目 


扩 击 “OK” 按 钮 后 进入 应 用 设置 向 导 界面 ， 如 图 3-4 所 示 。 





我 们 看 到 图 3-4 这 个 界面 时 ， 先 别 着 急 点 击 * 下 一 步 按 钮 ， 应 先 点 


击 左边 边栏 中 的 “应 用 程序 设置 "， 对 此 进行 初步 配置 。 然 后 进入 图 3-5 
所 示 的 界面 。 


Win32 应 用 程序 向 导 - cdemo 


mm 欢迎 使 用 Win32 应 用 程序 向 导 


和 这 些 是 当前 项 目 设置 

ee 。 控制 台 应 用 程序 
在 任 一 窗口 中 单 击 “ 完 成 ”接受 当前 设置 。 
创建 而 目 后 ， 请 参阅 读 硕 目的 resdne. txt 文件 ， 
的 信息 。 





图 3-4 ”Visual Studio 应 用 设置 向 导 


应 用 程序 类 型 : 
C 〇 ) Windows 应 用 程序 出 ) 
〇 DLLO) 
〇 静态 库 (s) 


附加 选项 : 
空 项 目 (E) 
转 寺 出 符 三 她 ) 
国 预 凯 幸 头 她) 





图 3-5 ”Visual Studio 项 目 创建 时 的 应 用 设置 


图 3-5 所 示 的 界面 中 ， 在 “附加 选项 ”中 ， 先 取消 勾 选 “ 预 编 译 尖 ”， 然 
后 色 选 “ 空 项 目 ”。 最 后 ， 扣 击 “ 完 成 ”按钮 进入 到 我 们 所 创建 的 cdemo 项 


目 工程 的 主 界面 。 此 时 ， 整 个 工程 是 空 的 ， 只 有 文件 夹 而 没有 任何 文 
件 ， 需 要 手工 新 建 C 源 文件 。 用 鼠标 右键 单 击 “ 源 文件 >， 选 择 “ 添 加 ” 
然后 再 点 击 “ 新 建 项 ”， 如 图 3-6 所 示 。 


解决 方案 资源 管理 需 
ee 各 部 -|@-s 时 | 
搜索 解决 方案 资源 管理 器 (Ctr|+;) 


网 解决 方案 cdemo"(1 个 项 目 ) 
4 [| cdemo 
bp we 引用 
响 外 部 依 款项 
绚 头 文件 


» 新 建 项 (W)... Ctrl+Shift+A 
Ctrl+Shift+X 现 有 项 (G)... Shift+Alt+A 
新 建 往 选 器 ( 
类 (QO).… 
Ctrl+X 资源 ([R)… 











图 3-6 ”Visual Studio 添 加 C 源 文件 


在 随后 弹出 的 如 图 3-7 所 示 的 对 话 框 中 ， 选 中 中 间 栏 中 的 “C++ 文 件 
(.cpp) ” 那 一 项 ， 然 后 在 底下 “名 称 ” 一 栏 输入 源 文件 名 。 





图 3-7 Visual Studio 命 名 C 源 文件 名 


四 这 里 需要 注意 ， 默 认 文 件 后 缀 名 是 .cpp， 即 C++ 源 文 
件 ， 因 为 Visual C++ 默认 采用 C++ 编程 语言 ， 因 此 我 们 这 里 要 手工 填写 .c 


文件 后 级 名 ， 使 得 后 续 我 们 用 C 编 译 占 进行 编译 构建 整个 控制 全 应 用 。 


完成 之 后 ， 我 们 点击 “添加 ”按钮 ， 然 后 再 次 进入 工程 主 界 面 ， 此 时 
即 可 看 到 C 源 文件 的 编辑 界面 了 。 


我 们 在 进入 源 文 件 编辑 界面 后 ， 先 对 Visual Studio 的 文本 编辑 选项 
做 些 处 理 ， 以 便于 我 们 后 续 可 以 流畅 地 编写 代码 。 如 图 3-8 所 示 ， 我 们 
在 上 面 的 荣 单 栏 找 到 “工具 ?”， 然 后 选择 “选项 ”。 


扩展 和 更 新 (U).… 

连接 到 数据 库 (D)… 

连接 到 服务 器 (S)… 

Web 代码 分 析 

代码 片段 管理 茵 (T).. Ctrl+K, Ctrl+B 
选择 工具 箱 项 (X).… 


创建 GUID(G) 
错误 查找 (K) 
Spy++(+) 
外 部 工具 (E)… 
导入 和 导出 设置 (1).. 
自 定义 (C).. 

撑 ”选项 (O)... 





图 3-8 ”Visual Studio 准 备 设置 编辑 选项 


点 击 进入 后 能 看 到 如 图 3-9 所 示 的 对 话 框 。 在 左边 栏 找到 “文本 编辑 
右 ” 这 个 选项 ， 然 后 将 它 展开 ， 选 中 “所 有 语言 ”随后 我 们 勾 选 上 “ 行 








号 ?”， 这 样 ， 在 编辑 每 个 文本 文件 时 都 能 看 到 行 号 ， 便 于 我 们 碍 找 代 码 
中 的 语法 错误 以 及 调试 代码 用 。 


记 ] 启用 虚空 格 (V) 
口 自动 绚 行 (W) 
[本 | 显示 可 视 的 自动 换行 标志 符号 (S) 
me ew | 


, 加 启用 单 击 URL 定位 (U) 


b Web 窗 休 设计 器 加 导航 栏 (N) 
i 加 自动 大 括号 完成 (B) 
We 加 没有 选 定 内 容 时 对 空 行 应 用 甘 切 或 复 


图 3-9 ”设置 编辑 选项 





最 后 ， 再 选中 “ 制 表 符 ”选项 ， 对 制 表 符 进 行 设置 ， 如 图 3-10 所 示 。 
习惯 上 ， 我 们 一 般 将 Tab Size 设 置 为 4 个 半角 字符 ， 纵 进 大 小 也 是 4 个 半 
角 字 符 ， 然 后 每 个 制 表 符 用 4 个 空格 代 答 ， 这 样 用 其 他 编辑 器 浏览 Visual 
Studio 编 辑 过 的 源 文 件 也 不 会 导致 格式 错乱 。 


制 表 符 


制 表 符 大 小 (T): [4 | 
缩 进 大 小 (1): 4 | 


〇 保留 制 表 符 (K) 





图 3-10 ”Visual Studio 设 置 制 表 符 


接 下 来 我 们 设置 当前 的 项 目 工 程 的 属性 选项 。 我 们 找到 沫 单 栏 
的 “项 目 ”， 然 后 点 击 “cdemo 属 性 ”， 如 图 3-11 所 示 。 


Ctr|l+Shift+X 


Ctrl+Shift+A 
Shift+Alt+A 


导出 模板 (E)... 
cdemo 屋 性 (站 





图 3-11 ” Visual Studio 设置 项 目 属 性 


在 配置 界面 的 常规 页 面 中 《〈 见 图 3-12) ， 先 找到 左上 角 的 “配置 ? 选 
项 ， 选 择 “ 所 有 配置 "。 这 样 ， 我 们 后 续 做 的 所 有 配置 都 对 Debug 模 式 与 
Release 模 式 同时 有 效 。 然 后 ， 在 右 侧 找 到 “平台 工具 集 ”"， 这 里 需要 选择 
使 用 “Visual Studio 2017-Clang with Microsoft CodeGen”， 这 个 选项 使 得 


我 们 对 当前 的 项 目 工程 使 用 Clang 编 译 工 具 链 进行 编译 构建 。 





Windows 10 
Windows SDK 版 本 10.0.14393.0 
办 出 目录 $(SolutionDir)$(Configuration)\ 
中 间 目 录 $(Configuration)\ 


${ProjectName) 

.Exe 
*.cdf*.cache;*.obj;*.obj.enc;*.ilk;*.ipdb;*.iobj:*.resources;*.tlb;*.t 
$(IntDirn)$(MSBuildProjectName).log 


(v141 clang _c2) 








图 3-12 ”Visual Studio 对 cdemo 项 目 工程 的 常规 设置 


随后 我 们 展开 C/C++ 这 一 项 ， 此 时 仍然 需要 先 将 左上 角 的 “配置 ” 设 
置 为 “所 有 配置 "。 然 后 找到 “语言 "， 将 “C 语 言 标准 ”设置 为 GSNU11 标 
准 。 这 样 我 们 就 能 在 Visual Studio Community 集 成 开发 环境 下 编写 调试 
大 部 分 基于 GNU11 标 准 的 C 语 言 代码 了 。 设 置 如 图 3-13 所 示 。 





C++ 语言 标准 
VC++ 目录 
4 C/C++ 


C11 (GNU Dialect) (-std=gnu11) 
< 从 父 豚 或 项 目 默认 设置 继承 > 





图 3-13 ”Visual Studio 设 置 C 语 言 标准 


全 都 设置 完成 之 后 ， 我 们 就 可 以 编写 第 一 个 C 语 言 程序 了 。 同 一 般 
C 语 言 教程 一 样 ， 我 们 这 里 也 通过 输出 一 个 “Hello，world! ”字样 ， 作 为 
第 一 个 C 语 言 代码 的 演示 程序 。 我 们 输入 图 3-14 中 所 示 的 代码 ， 然 后 点 
击 工具 栏 中 的 绿色 三 角 箭头 (图 3-14 中 用 矩形 框 圈 出 ， 即 可 编译 运行 
了 。 在 程序 最 后 的 getchar〈) 作用 在 于 : 弹出 的 控制 台 应 用 不 会 在 程序 
终止 时 马上 自动 关闭 ， 而 是 等 用 户 输入 一 个 回 车 时 再 关闭 。 


TEE TT IE 
oc cionome -| 














#1include <stdio. h> 
int main(void) 
putst”Hello, world!”): 


getchar () : 
} 
Ci\my programs\vc projects\cdemo\x64\Debug\cdemo.exe 


Hello，worldl 


1 
2 
3 
5 
6 
了 
8 
9 





图 3-14 ”在 Windows 控 制 台 输出 字符 串 


在 图 3-14 所 示 的 界面 中 ， 椭 圆 峰 出 来 的 部 分 用 于 设置 当前 程序 以 调 
试 模 式 构建 还 是 以 发 布 模式 构建 。 如 果 以 调试 模式 构建 ， 我 们 可 以 利用 








Visual Studio 内 建 的 调试 器 做 断 点 跟踪 ， 查 看 局 部 对 和 象 与 全 局 对 象 状 态 
以 及 寄存 器 状态 等 ， 便 于 调试 程序 。 如 果 以 发 布 模式 构建 ， 那 么 当前 程 
序 会 被 大 幅 优 化 ， 使 得 程序 运行 性 能 大 幅 提 升 ， 但 难以 调试 。 图 3-14 
中 ， 中 间 用 秆 形 框 圈 出 的 部 分 是 设置 当前 目标 程序 的 执行 模式 ， 默 认为 
x86， 即 32 位 执行 模式 。 这 里 我 们 将 它 设置 成 了 64 位 执行 模式 。 








3.1.2 ”安装 MinGW 编 译 器 


MinGW 编 译 器 是 音 名 开源 C 语 言 编译 器 GCC 对 Windows 操 作 系 统 的 
一 个 移植 版 本 。 通 过 MinGW， 我 们 就 可 以 在 Windows 下 享用 大 部 分 
GCC 编译 器 所 带 来 的 强大 功能 了 。 这 对 跨 平 台 的 C 语 言 开 发 而 言 十 分 有 
用 。 下 面 我 们 就 来 介绍 如 何 下 载 安装 MinGW 编 译 占 。 


首先 ， 我 们 直接 进入 这 个 网 址 下 载 安 装 文 件 : 
http://sourceforge.net/projects/mingw/files/latest/download? source=files。 
这 个 文件 非常 小 ， 因 为 MinGW 采 用 的 是 在 线 安 装 模 式 ， 茜 取 线 上 各 个 
最 新 release 版 本 的 组 件 进 行 下 载 。 





然后 ， 我 们 双击 安装 包 ， 初 步 安 六 完毕 后 弹出 对 话 框 如 图 3-15 所 
示 。 绿 色 进 度 条 表示 已 经 安装 好 了 。 





MinGW Installation Manager Setup Tool 


mingw-get version 0.6.2-beta-20131004-1 


名 


Step 2: Download and Set Up MinGW Installation Manager 
Downioad Progress 


Catalogue update compieted; please check 'Details' pane for errors. 


| Processed 110 of 110 items 2 | 100% 


ngw-get: *** INFO *** : unpacking mingw-get-setup-0.6.2-mingw32-beta-2 A 


: 过 倪 帮 : updating installation database 
: 安全 全 了 NFO 二 二 全 : register mingw-get-0.6.2-mingw32-beta-20131004 


.Xz 
: 三 业 和 ”INEFD 二 二 二 : register mingw-get-0,.6,2-mingw32-beta-20131004 
SE 
: ee INFO : register mingw-get-0.6.2-mingw32-beta-20131004 

1 二 人 INFO : installation database updated 





图 3-15 ”MinGW 初步 安装 成 功 


我 们 点 击 “Continue” 按 钮 后 ， 出 现 选择 安装 更 多 组 件 的 对 话 框 。 我 
们 在 左 侧 栏 点 击 “Basic"”， 即 采用 基本 安装 。 然 后 ， 在 右 侧 栏 安装 上 全 部 
列 出 的 组 件 。 要 选中 茶 个 安装 组 件 ， 鼠 标 右键 该 包 名 ， 然 后 在 快捷 沫 单 
中 选择 “Mark for Installation” 命 令 ， 如 图 3-16 所 示 。 








各 MinGW Installation Manager 


Installation Package Settings 


es PN Installed Version 


Mincy oyu—develoner—toolk] 
MSYs 
WSYS Base System 2 
MinGW Developer Toolkit Mark for | llation 
MSYS System Builder Mark for Reinstallation 
Mark for Upgrade 


Mark for Removal 


General | Description ee Ee 


An 而 SYS Installation for WinG¥ Derelopers (meta) 


图 3-16 ” MinGW 安装 ， 选 中 安装 包 








全 都 选择 好 之 后 ， 我 们 最 后 更 新 刚 选 好 的 安装 包 。 我 们 在 末 单 栏 选 
中 “Installation”， 然 后 点 击 “Update Catalogue”， 如 图 3-17 所 示 。 


名 MinGW Installation Manager 


Installation | Package Settings 
Update Catalogue ackage Class Installed Yersion 


Mark All Upgrades inaew—developer—toolkit bin 
newd2—autoconf bin 





Apply Cha 
PPY 人 Rnaw32-autoconf lic 


Quit naew32—autoconf2. 1 


1naew32—autoconf2. 1 
口 minaew32—autoconft2. 1 
minew32—autoconf2.5 
< 


Call| Description Md ee | rll ee 
图 3-17 MinGW 更 新 安装 包 





之 后 会 弹出 如 图 3-18 所 示 的 界面 ， 点 击 最 左边 的 “Review 


Changes” 按 钮 ， 会 弹出 如 图 3-19 所 示 的 对 话 框 。 


You have marked packages for installation, upgrade, or removal, 

全 but you have not yet committed these changes; if You update 
SP 的 pa they will be 
discarded, and you may need to reschedule them. 


You are advised to review your marked changes, before you update the 
catalogue; (you may select the "Review Changes” option button below), or 
altemnati 


7 you may simply discard the changes, unseen, or You may cancel 
this request to update the catalogue. 





图 3-18 ” ”MinGW 安装 要 求 确认 


点 击 “Apply” 按 钮 之 后 ， 就 会 下 载 安装 设置 更 新 后 的 安装 包 。 等 待 
全 都 安装 完毕 后 ， 点 击 “Close” 按 钮 ， 退 出 整个 安装 程序 。 


Okay to proceed? 


Te package changes iemsed below wl 


be implemented when you choose "Apply" 


0 installed packages will be removed 


0 installed packages will be upgraded 


97 new/upgraded packages wl be nstalled 


msyYsSCORE-1.0,18-1-msys-1.0.18-1ic. tar. lzma 
prs 0.18-1-msys-1.0.18-doc. tar. 1zma 
-0.20050421_1-2-msys-1.0. ee tar. lzma 
Tibgu? e-1.8,.7-2-m5sySs-1.0.15-rtm. tar. lzma 
egex-1.20090805-2-msys-1.0. 23-d11-1" tar.1 
de 20050421_1-2-msys-1.0.13-d1i1-0.tar. lzma 





图 3-19” ”MinGW 安装 更 新 


安装 结束 后 ， 不 要 着 急 使 用 ， 而 是 先 将 MinGW 的 bin 文 件 夹 注 册 到 
境 变量 中 。 先 打开 “文件 资源 管理 器 *， 在 左 侧 栏 中 找到 “此 电 
脑 ” 或 “我 的 电脑 ”， 鼠 标 右键 单 击 它 ， 选 择 “ 属 性 ”， 进 入 后 点 击 左 侧 
的 “高 级 系统 设置 ?， 如 图 3-20 所 示 。 








| we || | iA | 
图 3-20 ”进入 环境 变量 的 设置 界面 





进入 图 3-20 的 对 话 框 之 后 ， 点 击 “ 环 境 变量 ”按钮 ， 进 入 到 “环境 变 
量 ” 对 话 框 。 我 们 在 “系统 变量 ”区 域 选中 “Path” 变 量 ， 然 后 反击 “编辑 ” 按 
钮 ， 弹 出 “编辑 系统 变量 ”对 话 框 。 在 “变量 值 ”中 往 后 添加 刚才 安装 后 的 
MinGW 中 的 bin 文 件 夹 所 在 目录 。 在 环境 变量 中 的 每 个 值 之 间 用 半角 分 


号 “; ”进行 分 隔 ， 如 图 3-21 所 示 。 























mance ToolkitwCANLLVMAH 
本 


Windows_ NT 

C:\ProgramData\OracleJavaVavapath;C... 
PATHEXT .COM:;.EXE;:.BAT;.CMD:.VBS;.VBE:;.JS:JSE;.... 
PROCESSOR AR... 





图 3-21 进入 环境 变量 设置 Path 





完成 之 后 ， 我 们 就 可 以 打开 控制 合 程序 〈 方 法 是 右键 昌 面 上 左下 
角 “ 开 始 ” 按 钮 ， 然 后 选择 命令 提示 符 )， 然 后 进入 要 编译 的 C 源 文件 所 
在 的 目录 。 然 后 用 gcc 命 令 对 指定 C 源 文件 进行 编译 构建 ， 如 图 3-22 所 


作 \。 





这 里 ， 我 们 借用 之 前 在 Visual Studio Community 下 编辑 好 的 源 文件 
test.c。 我 们 先 用 cd 命令 定位 到 test.c 所 在 的 目录 。 然 后 用 gcc--version 命 令 
查看 当前 GCC 编 译 上 器 的 版 本 。 最 后 ， 用 gcc-std=gnu1ll test.c 进 行 编译 ， 
最 终 在 当前 目录 生成 a.exe 可 执行 文件 。 我 们 直接 键入 a， 回 车 ， 即 可 看 
到 程序 输出 结 








要 注意 的 是 ，MinGW 是 32 位 的 C 语 言 编译 器 ， 所 以 它 构 建 出 来 的 程 
序 也 是 32 位 的 。 如 果 各 位 用 的 Windows 操 作 系统 是 64 位 的 ， 那 么 可 以 使 
用 Mingw-w64 编 译 器 。 下 载 地 址 如 下 : 
https://sourceforge.net/projects/mingw-w64/files/latest/download? 


source=files。 


Mingw-w64 的 安装 、 设 置 过 程 与 32 位 的 MinGW 类 似 ， 这 里 不 再 净 


3.1.3” 安 又 LLVM Clang 编 详 颖 


LLVM (Low Level Virtual Machine) 起 源 于 一 个 大 学 项 目 ， 它 是 一 
个 编译 器 基础 架构 项 目 ， 用 于 设计 一 组 具有 良好 定义 的 、 可 重用 的 库 。 
LLVM 起 先 用 于 替代 GCC (这 里 的 GCC 是 指 GNU Compiler Collection ) 
栈 中 的 代码 生成 器 ， 然 后 对 GCC 中 已 有 的 许多 编译 器 进行 修改 以 适 配 
LLVM。 后 来 LLVM 发 起 了 开发 一 个 全 新 的 适用 于 不 少 编程 语言 的 编译 
器 前 端 ， 称 为 Clang。Clang 主 要 支持 C、C++、Objective-C 等 编程 语言 ， 
并 且 主 要 由 Apple 公 司 大 力 支持 和 维护 。LLVM 与 Clang 都 基于 BSD 许 可 
证 ， 比 GPL 更 宽松 。 正 因 如 此 ， 现 在 许多 硬件 商都 逐渐 开始 投入 对 
LLVM 的 支持 ， 像 Khronos 开 放 标 准 组 织 也 基于 LLVM IR (Intermediate 
Representation ) 开发 出 了 自己 的 一 套 SPIR-V。Clang 编 译 器 在 语法 上 力 
争 文 持 各 大 主流 编译 器 的 语法 扩展 ， 包 括 GCC 和 MSVC， 所 以 微软 也 已 
经 把 Clang 纳 入 Visual Studio 集 成 开发 环境 的 工具 集中 。 








2016/1/3 19:11 文件 夫 
2016/1/3 19:09 文件 夫 
2016/1/5 2:54 应 用 程序 
demo.vcxproj 2016/1/4 0:58 VC++ Project 
BB cdemo.vcxprojfilters 2016/1/3 19:11 VC++ Project Fil... 
| cdemo.vcxproj.user 2016/1/3 19:08 Visual Studio Pr.., 
BB test.c 2016/1/4 1:38 C Source 


| EE 
《ce> 2913 Microsoft Corporation, 保 留 所 有 书 


:VsekrsNcy>cd C:Nuc_phkogkhamsNcdemoNcdemo 


:wc_programs \cdemo\cde moPgce -version 
gcc CGCC> 4.8.1 


Copyright 〈《C) 20913 Free Softwake Foundation。 Inc -. 
his is free software; See the source for copying conditions. There is NO 
Jarranty; not euen for MERCHANTABILITY or FITNESS FOR f PARTICULAR PURPOSE. 


:Wwc_programs cdemo\cdemolgcc -std=gnuili1 test.c 


:Wwc_programs cdemo\cdemo»a 


你 好 ， 世 界 ! 








:Wwc_programs \cdemo \cdemo> 


图 3-22 ”用 GCC 构建 C 程 序 


我 们 首先 在 LLVM Clang 官 网 下 载 最 新 稳定 发 布 版 本 的 Clang 安 装 
包 : http://llvm.org/releases/download.html。 然 后 ， 要 注意 的 是 选择 32 位 
版 本 ， 如 图 3-23 所 示 。 


Documentation: 


LLVM (release notes) 
Clang (release notes) 


for Fedora22 x86 64 Linux C sig) 
- - 区 这 


DpenM 86 64 Li 
* 0penMP runtime for Darwin (. sig) 
Signed with PGP key 345AD05D， 





图 3-23 ”下载 Clang for Windows (32-bit) 


由 于 Clang 主 要 是 一 个 编译 需 前 端 ， 因 此 它 需要 依赖 其 他 编译 局 的 
连接 器 以 及 东 些 运行 时 库 。 所 以 ， 我 们 光 安 闭 Clang 是 无 法 直接 成 功 构 





建 应 用 程序 的 ， 因 而 我 们 要 使 用 Clang 的 话 ， 必 须 在 此 之 前 先 把 MinGW 
安装 好 。MinGW 是 32 位 的 ， 因 此 为 了 二 进 制 兼容 ， 我 们 所 选取 的 Clang 
也 必须 是 32 位 的 。 当 然 ， 如 果 之 前 安装 的 是 64 位 的 MingW-W64， 那 么 
这 里 需要 下 载 安装 64 位 的 Clang。 





安 六 Clang 的 过 程 非常 简单 ， 可 根据 安装 问 导 简单 地 做 些 选择 即 可 
完成 安装 。 安 装 完成 后 ， 可 以 去 “系统 ”里 的 环境 变量 中 看 ， 把 LLVM 有 目 
录 下 的 bin 文 件 夹 的 路 径 添加 到 Path 环 境 变量 中 ， 如 图 3-24 所 示 。 然 后 就 
可 以 再 次 使 用 命令 行 工具 直接 编译 运行 程序 了 。 








3] a.exe 2016/1/5 22:24 
cdemo.vcxproj 2016/1/4 0:58 
Bj] cdemo.vcxproj.filters 2016/1/3 19:11 
cdemo.vcxproj.user 2016/1/3 19:08 
BB test.c 2016/1/4 1:38 


icrosoft Windows [RR 6.3.93688] 
<c> 20913 Microsoft Corporation, 保留 所 有 权利 。 


:Nsers\cy?2cd CGC: wc_programs \cdemo \cdemo 


:Wwc_programs \cdemo\cdemo clang ——version 


lang version 3.7.0 tags/h 
arget: i686—pc—-windows—gnu 
hread model: posix 


:Wce_programs cdemo\cdemoPclang -std=gnuilli test.c 


:Wwc_programs \cdemo\cdemo>a 
Fw 
你 好 ， 世 界 ! 


:WcC_programs cdemo\cdemo> 





图 3-24 ”用 Clang 编 译 器 构建 应 用 程序 


3.2 ”macOS 系 统 下 搭建 C 语 言 编程 环 赴 


macOS 系 统 也 不 默认 上 自 带 C 语 言 编译 恬 。 然 而 ， 用 户 可 以 目 己 去 
Mac App Store 免 费 下 载 macOS 下 的 强大 开发 工具 
https://itunes.apple.com/cn/app/xcode/id497799835? mt=12。 该 集成 开发 
工具 采用 Apple 定 制版 本 的 Clang 编 译 器 ， 称 为 Apple LLVM 编 译 器 。 它 
自 带 C、C++、Objective-C 以 及 Apple 自 己 新 推出 的 Swift 编程 语言 编译 
器 ， 还 有 一 系列 功能 强大 的 代码 静态 分 析 以 及 性 能 剖析 工具 。 


Xcode: 





下 载 完 Xcode 之 后 ， 把 它 打 开 。 如 果 是 第 一 次 启动 ，Xcode 会 自动 
更 新 一 些 资源 ， 完 了 之 后 弹出 主 界面 ， 如 图 3-25 所 示 。 


我 们 选择 第 二 个 选项 ， 点 击 它 即 可 创建 应 用 程序 工程 。 第 一 个 选项 
仅 用 于 操练 把 玩 Swift 编 程 语言 ， 而 第 二 个 选项 用 于 创建 真正 的 应 用 或 
库 。 当 然 ， 有 些 应 用 可 直接 提交 到 App Store 审 核 ， 有 些 则 不 行 。 


点 击 “Create a new Xcode project" 之 后 ， 出 现 图 3-26 所 示 的 对 话 框 。 
在 图 3-26 中 ， 我 们 看 到 在 上 面 一 栏 中 所 选 的 项 目 工程 为 macOS 的 应 用 。 
然后 在 下 边 ， 我 们 选择 “Command Line Tool”， 即 命令 行 工 具 。 最 左边 
的 Cocoa Application 用 于 创建 macOS 系 统 上 基于 GUI 以 及 沙 盒 机 制 的 应 
用 ， 它 可 以 上 传 到 Mac App Store。 中 间 的 “Game” 专 门 用 于 游戏 应 用 ， 
也 可 上 传 到 Mac App Store。 而 最 右边 的 “Command Line Tool” 构 建 出 来 





的 应 用 则 无 法 上 传 到 Mac App Store， 但 是 它 能 访问 macOS 的 整个 文件 系 
统 ， 并 且 没 有 采用 沙 盒 机 制 。 另 外 ， 开 发 者 用 Command Line Tool 开 发 
出 来 的 应 用 也 可 以 直接 放 到 网 上 供 其 他 人 下 载 使 用 。 


Welcome to Xcode 


Version 8.2.1 {8C1002) 


Get started with a playground 
Explore new ideas quickly and easily. 


Create a new Xcode project 
Create an app for iPhone, iPad, Mac 台 pple Watch or Apple TV. 


Check out an existing project 
Start working on something from an SCM repository. 





图 3-25 ”Xcode 欢迎 界面 


Choose a template for your new project: 


i0OS watchOS tvOS 


Application 


Command Line 
Tool 





图 3-26 ”选择 MacOS 命 令 行 工 具 应 用 项 目 


我 们 点 击 “Next” 按 钮 之 后 出 现 如 图 3-27 所 示 的 对 话 框 。 在 第 1 行 用 英 
文 输入 自己 的 产品 名 称 ， 这 个 后 面 将 用 于 自动 生成 的 工程 名 称 。 然 后 第 
2 行 填写 组 织 名 。 第 3 行 填写 组 织 标识 ， 格 式 为 com.< 公 司 名 >.< 产 品名 
>。 当 然 ， 第 2、 第 3 行 对 于 我 们 的 demo 而 言 可 以 随意 填写 。 第 5 行 我 们 
要 选择 C， 表 示 使 用 C 语 言 。 


Product Name: |CDemo 
Organization Name: | GreenGames Studio 


Organization Identifier: | com.greengames.cdemo 


























Bundle Identifier com.greengames.cdemo.CDemo 








Language: | € 


图 3-27 ”输入 macOS 命 令 行 应 用 的 属性 





点 击 “Next” 按 钮 可 看 到 图 3-28 所 示 的 目录 选择 对 话 框 。 


bp 
> 
pb 
bp 
bp 
bp 
bp 
bp 
pb 
> 
Bb 


国 Programs 


Source Control: | | Create Git repositorylbn My Mac 
ode will place your project under version control 


图 3-28 macOS 命 令 行 应 用 生成 目录 选择 对 话 框 








这 里 选择 将 新 创建 的 项 目 工程 放 到 哪个 目录 下 。 男 外 ， 这 里 要 注意 
的 是 ， 我 们 不 要 勾 选 “Create Git repository” 这 一 选项 。 因 为 它 会 在 工程 
本 地 做 git 版 本 管理 ， 对 于 我 们 一 般 应 用 而 言 没 有 任何 必要 ， 而 且 这 会 随 
着 工程 构建 的 次 数 增多 而 增 大 ， 很 占 磁 盘 空 间 。 而 且 如 果 要 将 本 地 工程 
拷贝 到 其 他 环境 ， 也 会 带 来 许多 不 便 。 我 们 最 后 点 击 “Create” 按 钮 之 
后 ， 工 程 就 会 被 创建 好 。 





工程 被 创建 完 之 后 ，Xcode 默 认 会 打开 ， 包 括 会 自动 创建 一 个 


main.c 的 C 语 言 源 文 件 。 此 时 ， 我 们 不 用 着 急 编辑 、 运 行 ， 可 以 先 设 置 
一 下 编译 选项 。 


我 们 首先 点 击 蓝 色 的 “CDemo” 项 目 工程 图 标 ， 然 后 点 击 中 间 一 
栏 *TARGETS” 下 的 “CDemo” 控 制 台 图 标 ， 最 后 在 右边 栏 的 最 上 方 选 
中 “Build Settings”， 然 后 在 下 面 选中 “All* 和 “Combined”。 随 后 ， 我 们 找 
到 “Apple LLVM x.x-Language” 这 一 栏 ， 将 “C Language Dialect” 选 为 
gnul1， 这 个 选项 将 贯穿 本 书 内 容 。 到 此 ， 我 们 的 C 语 言 编译 选项 就 设 定 


好 了 ， 如 图 3-29 所 示 。 











Resource Tags Build Phases Build Rules 


Basic All Combined Levels 











VY Apple LLVM 7.0 - Language 
Setting 
'char’ Type ls Unsigned 
Allow 'asm''iniine''typeof' 
PC Language Dialect 


Compile Sources As 

Enable Linking With Shared Libraries 

Enable Trigraphs 

Generate Floating Point Library Calls 
Increase Sharing of Precompiled Headers 

Precompile Prefix Header 

Prefix Header 

Recognize Built-in Functions 

Recognize Pascal Strings 

Short Enumeration Constants 

Use Standard System Header Directory Searching 


图 3-29 ”macOS 项 目 设 置 工程 配置 选项 














如 果 我 们 想 对 最 终生 成 的 代码 再 做 一 些 优 化 ， 可 以 设置 图 3-30 中 的 


一 些 选项 。 


了 AppleLLVM7.0 -Language - C++ 
Setting | 图 CDemo 
C++ Language Dialect GNU++11[-std=gnu++11] 仿 
C++ Standard Library 
nable C++ 上 xceptions 
Enable C++ Runtime Types 





了 AppleLLVM70 -Language - Modules 
Setting 
Allow Non-modular Includes In Framework Modules 
Enable Clang Module Debugging 
Enable Modules (C and Objective-C) 
Link Frameworks Automatically 





了 AppleLLVM7.0 - Language - Objective C 


Enable Objective-C Exceptions 
Implicitly Link Object Runti 





图 3-30 macOS 项 目 设 置 其 他 编译 选项 


我 们 将 C++ 的 异常 以 及 运行 时 类 型 (RTTI) 全 都 关闭 ， 力 外 也 将 
Objective-C 的 异 第 天 财 。 这 样 ， 最 终 的 应 用 程序 中 将 不 会 包含 异常 栈 ， 
同时 ， 编 译 器 后 端 优化 也 能 更 省 力 不 少 。 大 家 可 以 观察 到 ， 将 这 几 个 选 
项 关闭 后 ， 最 终生 成 的 可 执行 文件 会 比 开 启 时 要 小 一 些 。 


最 后 ， 我 们 可 以 设置 一 下 Xcode 自身 的 偏好 设置 ， 将 行 号 显示 出 
来 ， 如 图 3-31 所 示 。 








图 3-31 打开 Xcode 偏好 设置 


我 们 在 菜单 栏 上 ， 选 择 “Xcode”， 然 后 点 击 “Pre-ferences...”， 弹 出 图 
3-32 所 示 的 对 话 框 。 我 们 把 “Line numbers” 勾 选 上 即 可 在 文本 编辑 框 中 
看 到 行 号 。 另 外 ，Xcode 默 认 字 符 编码 已 经 是 UTF-8 了 ， 因 此 不 需要 我 
们 做 额外 的 设置 。 





Text Editing 


当今 Bp 国 血 思 


General Accounts Behaviors Navigation Fonts & Colors TextEditingi Key Bindings Source Control Downloads Locations 








Editing Indentation 





[¥) Line numbers 
口 Code folding ribbon 
[M] Focus code blocks on hover 


DOD Page guide at column: 80| | 7 
[v) Highlight instances of selected symbol 


Delay: 0.25 Q seconds 














Code completion: [v) Suggest completions while typing 

[M Use Escape key to show completion suggestions 
Automatically insert closing braces ("}") 

Enable type-over completions 

[¥] Automatically balance brackets in Objective-C method calls 





While editing: [(v] Automatically trim trailing whitespace 
口 ] Including whitespace-only lines 





Default text encoding: _Unicode (UTF-8) 


Default line endings: | OS X / Unix (LF) ] 


DOD Convert existing files on save 





Code coverage: [V] Show iteration counts 





图 3-32 Xcode 设置 文本 编辑 属性 


由 于 Xcode 默认 字体 可 能 会 显得 比较 小 ， 因 此 如 果 想 设置 字体 以 及 
背景 颜色 的 话 可 以 选择 “Fonts&Colors” 选 项 。 


在 进入 到 此 对 话 杠 后， 我 们 点 击 左 侧 栏 下 边 的 “+ 号， 添加 一 个 新 
的 字体 ， 并 且 选 择 “Duplicate‘Default”， 如 图 3-33 所 示 。 这 使 得 我 们 所 
新 增 的 字体 以 默认 字体 和 颜色 作为 基准 ， 然 后 对 它 做 大 小 修改 。 


Duplicate "Default” 


New Theme from Template 
Bare 

Basic 

Default 

Dusk 


Low Key 

Midnight 
Presentation 
Presentation Large 
Printing 

Spartan 

Sunset 





图 3-33 Xcode 字体 设置 ， 添 加 新 字体 


如 图 3-34 所 示 ， 我 们 这 里 新 增 了 一 个 叫 “Defualt_Big” 的 字体 ， 然 后 
在 中 间 这 栏 ， 我 们 先 选中 “Plain Text”， 人 然后 将 滚动 条 滚动 到 最 下 方 ， 按 
住 Shift 键 再 选中 最 后 一 条 “Other Preprocessor Macros”， 这 样 可 以 将 所 有 
种 类 的 文字 格式 全 都 选中 ， 随 后 我 们 点 击 “T" 字 样 的 按钮 来 调整 这 些 文 
字 格 式 的 字体 大 小 。 这 里 ， 原 先 的 字体 大 小 为 “Menlo Regular-11.0”， 设 
置 之 后 这 里 变 为 “Menlo Regular-14.0”。 








Source Editor Console 


Ee] 


Cursor 








Invisibles 


图 3-34 Xcode 设置 新 字体 格式 与 大 小 


现在 ， 我 们 就 可 以 直接 运行 Xcode 自动 帮 我 们 生成 好 的 main.c 中 的 C 


源 代码 了 。 我 们 直接 点 击 右 上 和 角 的 三 角 箭头 按钮 即 可 编译 并 运行 这 段 代 
人 码 ， 如 图 3-35 所 示 。 


o00 CI mews ww 
白 室 A SS 于 已 时 | 曲 |《< >》| 国 CDemo) 训 | CDemo) [© main.c ) No Selection 
v 国 cpemo A 
了 国 cpemo main.c 
ad 


CDemo 


» BM Products Created by Zenny Chen on 15/12/29. 
Copyright @ 2015 年 GreenGames Studio. All rights reserved. 
#include <stdio.h> 
0 
人 main(int argc, const char * argv[]) 
2 
// insert code here... 
printf(u8"Hello，World!\n 你 好 ， 世 界 ! \n"); 
} 








图 3-35 ”编译 运行 macOS 控 制 台 应 用 


我 们 在 下 面 的 调试 控制 合 中 能 看 到 图 3-35 这 两 行文 字 。 其 中 ， 最 后 
一 句 是 应 用 退出 后 系统 目 动 打印 的 。 我 们 可 以 看 到 ，macOS 下 能 非常 轻 
松 地 直接 输出 中 文 ， 而 不 需要 各 种 复杂 的 编码 转换 。 


Hello, World! 
你 好 ， 世 界 ! 


Program ended with exit code: 9 





All Output © 


oq, 
i 
a 
a 
涅 


图 3-36 ”macOS 控 制 台 程 


3.3 本章 小 结 


本 章 主 要 讲述 了 Windows 操 作 系 统 下 如 何 使 用 Visual Studio 
Community、MinGW 和 LLVM Clang 进 行 C 语 言 程序 开发 ， 同 时 也 讲解 
了 如 何在 macOS 下 使 用 Xcode 做 C 语 言 程序 开发 。 因 为 Windows 操 作 系 统 
与 macOS 系 统 用 得 比较 广泛 ， 而 且 它 们 都 主要 基于 GUI 的 集成 开发 环境 
进行 编程 ， 所 以 我 们 做 重点 讲解 。 而 在 各 个 版 本 的 Linux 下 基本 都 默认 
安装 了 GCC 编 译 器 ， 各 位 可 以 直接 在 Linux 系 统 下 的 命令 行 终 端 使 用 gcc 
命令 对 C 语 言 源 文件 做 编译 构建 。 而 当前 FreeBSD 最 新 发 布 版 本 默认 使 
用 了 LLVM Clang 编 译 器 ， 各 位 也 可 以 直接 在 命令 行 终端 使 用 clang 命 令 
对 C 语 言 源 文件 做 编译 构建 。 











另外 ，Linux、FreeBSD 系 统 下 ， 笔 者 推荐 使 用 的 集成 开发 环境 是 
Eclipse。 它 拥有 比较 基本 的 代码 智能 感知 ， 设 置 断 点 进行 调试 的 功能 ， 
而 且 它 也 是 一 款 开 源 免 费 的 软件 。 当 然 ， 要 局 动 Eclipse 必须 移 下 载 
JRE (Java Runtime Environment) ， 这 个 可 以 从 Oracle 官 网 下 载 。 








截至 本 章 ， 第 一 部 分 的 讲解 结束 ， 各 位 读者 应 该 对 C 语 言 的 由 来 、 
用 途 以 及 各 种 准备 工作 都 了 解 得 差不多 了 吧 ? 下 面 我 们 将 进入 第 二 部 
分 ， 正 式 开 局 C 语 言 魔 法 的 大 门 ! 





第 二 篇 ”基础 语法 篇 











C 程 序 的 作用 域 与 名 字 空 间 







基础 语法 篇 
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灵活 的 


内 


可 


指 加 


豆 | | 下 本 局 
JE 





加 
8 
Pad 
世 
亚 
所 
还 
还 
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第 4 草 ”C 语 言 中 的 基本 元 系 





本 章 将 正式 进入 C 语 言 编程 话题 。 我 们 在 第 1 章 已 经 大 致 介绍 了 C 语 
言 的 编译 、 连 接 和 加 载运 行 流程 ， 参 见 图 1-2。 我 们 首先 介绍 C 语 言 单个 
源 文 件 的 基本 构成 以 及 基本 元 素 。 


main.c 、 又 

CDemo 注释 

Created by Zenny Chen on 15/12/29. 

Copyright © 2015 年 GreenGames Studio. ALL rights reserved . 


#include <stdio.h> 二 一 允 处 理 器 


主 图 数 入 口 


int main(int argc, const char * argv[]) 


// insert code here... 过 一 一 注释 


puts(u8"HeLto，WortLdiNn 你 好 ， 世 界 ! "); 


1 
2 
3 
4 
5 
6 
7 
8 
9 
0 
1 
2 
3 
4 
5 
6 
7 
8 





图 4-1 C 源 文件 的 基本 构成 





我 们 在 图 4-1 中 能 看 到 ， 一 个 可 用 来 编译 执行 的 基本 C 源 文件 主要 包 


第 1 部 分 是 注释 。 注 释 主要 用 于 给 源 代码 做 批注 ， 方 便 阅 读 和 维 
护 。 编 译 占 会 忽略 所 有 注释 部 分 ， 而 且 注 释 部 分 在 预 编译 处 理 结束 后 就 


不 存在 了 。 我 们 将 在 10.9 节 讨论 程序 注释 。 


第 2 部 分 是 预 处 理 器 (Preprocessor) 。 图 4-1 中 的 第 9 行 代码 就 是 一 
条 ##include 预 处 理 器 ， 它 将 标准 库 头 文件 “stdio.h” 中 的 所 有 内 容 都 直接 放 
到 当前 源 文 件 中 ， 这 样 我 们 就 可 以 将 它 看 作 在 第 9 行 这 个 位 置 插入 此 头 
文件 的 所 有 内 容 ( 这 里 我 们 可 以 先 无视 上 面 的 注释 部 分 的 处 
理 ) 。“stdio.h” 文 件 包 含 了 第 16 行 所 用 到 的 puts 标 准 库 函 数 的 原型 。 我 
们 将 在 第 10 章 详细 讨论 预 处 理 器 。 








第 3 部 分 是 主 函 数 入 口 main。 它 是 C 程 序 的 入 口 函数 。 也 就 是 说 ， 当 
操作 系统 加 载 完 我 们 构建 生成 的 C 程 序 后 ， 率 先 执行 的 就 是 main 函 数 。 
关于 main 函 数 ， 我 们 将 在 9.9 节 中 介绍 。 


第 4 部 分 是 用 { 包 围 着 的 函数 具体 实现 代码 〈 第 13 一 17 行 ) 。 这 里 
的 实现 就 是 第 16 行 打印 输出 两 行文 字 。 


C 语 言 的 头 文件 一 般 用 .h 后 级 表示 ， 源 文件 一 般 用 .c 后 级 表示 。C 源 
文件 是 一 个 文本 文件 ， 所 以 它 是 由 一 系列 字符 构成 的 。 下 一 节 将 介绍 C 
源 文 件 中 可 用 的 字符 集 以 及 执行 C 程 序 时 可 用 的 字符 集 。 





4.1 Ci 语言 中 的 字符 集 





一 般 来 次 ， 编 程 语言 的 字符 集 都 可 分 为 两 组 : 一 组 叫 源 字符 集 ， 忆 
一 组 叫 执行 字符 集 。 所 谓 “ 产 字符 集 是 指 在 写 C 源 代码 时 用 的 字符 集 ， 
也 就 是 呈现 在 C 源 文件 中 的 字符 集 。 而 “执行 字符 集 ” 是 指 编译 构建 完 源 
文件 后 的 目标 二 进 制 文件 中 所 表示 的 字符 集 ， 它 将 用 于 运行 在 当前 的 执 
行 环 境 中 。 比 如 ， 我 们 在 控制 台 或 者 GUI 窗 口 视图 上 所 看 到 的 文字 信息 
就 属于 执行 字符 集 。 




















C 语 言 标准 允许 C 语 言 实现 采用 多 字符 扩展 字符 集 ， 但 古 必须 要 满 
足 一 组 基本 字符 集 。 基 本 字符 集 都 包含 在 ASCII 码 可 显 字符 集中 ， 包 括 
半角 的 大 写字 母 A 一 2、 小 写字 母 a 一 z、 半 角 的 阿拉 伯 数 字 0 到 9 以 及 下 


列 符号 : 


为 了 叙述 方便 ， 上 述 这 排 符 号 后 续 将 统称 为 “标点 符号 ”， 而 大 小 写 
半角 英文 字母 统称 为 “字母 ”半角 阿拉 伯 数 字 0 到 9 统称 为 “数字 ”。 





由 于 在 C 语 言 的 上 述 基 本 字符 集中 有 9 个 字符 超出 了 ISO 646 不 变 字 
符 集 的 范围 ， 分 别 是 : # \ 人 ^ [ ] | 人 } ~。 所 以 ， 在 C90 标 准 


中 就 引入 了 三 字符 连 拼 (Trigraph〉 的 方式 来 表达 这 9 个 字符 : 
? ?= 对 应 于 # 
? ? ) ”对 应 于 ] 
? ?3 ! 对 应 于 | 
? ? ( 对 应 于 [ 
3 应 于 
? ?> 对 应 于 } 
2 对 应 于 、 
??< 对 应 于 1{ 
? - 对 应 于 ~ 


例如 : 





??=def?ine arraycheck(a, b) a??(b??) 2??31?3?31 b??3(a??) 
printf(“Eh??2?/n” ); 

// 上 述 代 码 等 价 于 : 
#define Py b) arb] || bl[al] 
printf(“Eh?\n” ); 











这 里 我 们 还 能 再 呈现 一 下 源 字 符 集 与 执行 字符 集 的 差异 。 上 述 代码 
中 ,“? ? ? /n” 表 示 源 字符 集 ， 它 在 C 源 文件 中 就 是 如 此 写 的 ;而 最 后 








翻译 成 的 An”" 就 相当 于 执行 字符 集 ， 显 示 在 命令 行程 序 中 就 是 一 个 换 


行 。 


由 于 C++17 标 准 打算 废弃 三 字符 连 拼 ， 笔 者 估计 下 一 个 C 语 言 标准 
也 将 废弃 三 字符 连 拼 机 制 ， 因 此 不 建议 各 位 使 用 ， 大 家 只 要 了 解 一 下 这 
个 历史 即 可 。 


C99 标 准 中 引入 了 对 其 中 5 个 字符 的 双 字 符 连 拼 (Digraph) 表示 。 
<: ”对 应 于 [ 
: > 对 应 于 ] 
<% 对 应 于 { 
%> 对 应 于 } 
%: ”对 应 于 # 


双 字 符 连 拼 在 下 一 个 标准 中 还 能 正常 使 用 。 尺 管 Trigraph 与 Digraph 
基本 用 不 上 ， 不 过 在 看 一 些 较 早 之 前 欧洲 一 些 国家 的 人 所 写 的 代码 时 能 
知道 那 是 什么 。 由 于 笔者 在 日 本 做 过 一 些 项目 ， 所 以 知道 在 Windows 系 
统 下 的 日 语 环 境 中 ，“\* 这 个 符号 会 被 显示 成 “ 丫 ”。 因 此 当 我 们 看 
到 “六 ”符号 时 能 反应 出 是 “就 行 。 





4.2 C 语 言 中 的 token 





在 编程 语言 中 经 常会 涉及 “token” 这 个 词 ，token 这 里 不 是 指 网 络 通 
信 中 所 谓 的 “ 令 牌 >， 而 是 用 于 词法 解析 的 ， 通 过 指定 一 个 词 位 〈 词 的 单 
位 ) 的 类 别 来 结构 化 表示 该 词 位 。 如 以 下 代码 : 











int a = 3 << 2 





这 里 就 有 7 个 token， 分 别 是 : int、a、=、3、<<、2 以 及 最 后 的 分 
号 ;。 这 一 行 代码 中 就 已 经 列 出 了 C 语 言 中 的 常用 几 种 token， 分 别 是 关 
键 字 (Cint) 、 标 识 符 〈a) 、 字 面 量 (3 和 2) 、 操 作 符 〈= 和 <<) 、 其 他 
标点 符号 〈; ) 。 每 个 token 之 间 用 衬 日 符 或 标点 符号 进行 分 隅 。 空 白 
符 主 要 包括 空格 〈white space) 、 制 表 符 (tab) 以 及 换行 回 车 。 像 上 述 
代码 也 能 写成 以 下 形式 ， 两 者 是 等 价 的 。 





int a=3<<2,， 





但 是 ， 这 里 int 与 a 之 间 必 须 用 空白 符 分 害 


-一 


O 


C 语 言 标准 中 定义 了 token 和 预 处 理 token， 分 别 用 于 在 编译 时 和 预 编 
译 时 的 符号 解析 。token 包 括 关 键 字 、 标 识 符 、 常 量 、 字 符 串 字面 量 以 
及 标点 符号 。 预 处 理 token 主 要 包括 头 文 件 名 、 标 识 符 、 预 处 理 数 、 字 


符 常 量 、 字 符 串 字面 量 、 标 点 符号 以 及 不 属于 上 述 符号 的 每 个 非 空 白字 














下 面 我 们 将 分 别 描述 标识 符 、 关 键 子 、 常 量 与 字符 串 字 面 量 、 标 点 


符号 这 几 种 token。 预 处 理 token 将 放 在 第 10 章 做 详细 描述 。 





4.2.1 CC 语言 中 的 标识 符 





在 C11 标 准 中 提 到 ，C 语 言 中 的 标识 符 可 以 表示 一 个 对 象 
Cobject) ， 一 个 函数 〈function) ， 一 个 结构 体 〈structure) 、 联 合体 
(union) 或 枚 举 〈enumeration) 的 一 个 名 字 〈C11 标 准 中 将 结构 体 、 联 
合体 以 及 枚 举 类 型 的 名 字 称 为 tag) 或 其 中 一 个 成 员 、 一 个 typedef 名 、 
一 个 跳 转 标签 (label〉 名 、 一 个 宏 (macro) 名 或 一 个 宏 的 形 参 
(parameter) 。 妆 我 们 提 到 “标识 符 ” 时 ， 要 意识 到 标识 符 不 仅仅 是 上 述 
所 摘 述 实体 的 名 称 ， 而 且 也 是 对 它们 的 引用 (reference) 。 








一 般 C 语 言 的 实现 约定 ， 一 个 标识 符 由 基本 字符 集中 的 所 有 大 小 写 
英文 字母 、 阿 拉 伯 数 字 0 到 9 以 及 下 划 线 构成， 并且 标识 符 不 能 以 数字 
开头 。 比 如 : aBc、_ab、C11、_3 都 是 有 效 的 标识 符 ; 5ab、a (2、886 
都 是 无 效 的 标识 符 。 有 些 C 语 言 实现 允 许 将 $ 作 为 构成 标识 符 的 有 效 字 
符 ， 但 有 些 是 将 含有 $ 的 标识 符 作 为 一 种 内 部 使 用 的 特殊 符号 来 用 ， 所 
以 我 们 在 命名 标识 符 的 时 候 应 该 避免 使 用 $ 符 号 。 此 外 ，C11 标 准 允 许 使 
用 多 字 节 扩展 字符 集 〈 通 用 字符 名 ) 来 命名 标识 符 ， 但 不 能 违背 上 述 基 




















本 约定 。 比 如 ， 在 Apple LLVM 编 译 器 中 ， 人 允许 使 用 中 文 、 拉 丁字 母 、 
希腊 字母 等 作为 标识 符 : avno、bonné、 小 蚀 游 :六 花 、5 一 x 等 都 是 
有 效 标识 符 ， 但 是 像 3 百 九 、 十 * 二 ， 这 些 就 是 无 效 的 标识 符 。 此 外 ，C 
语言 标准 中 还 规定 ， 如 果 一 个 标识 符 含 有 通用 字符 名 ， 那 么 每 一 个 通用 
字符 名 必须 落 在 ISO/IEC 10646 编 码 方式 的 以 下 范围 内 〈 用 十 六 进 制 表 


示 ) : 


1) 00A8，00AA，00AD，00AF，00B2 一 00B5，00B7 一 00BA， 
00BC 一 00BE，00C0 一 00D6，00D8 一 00F6，00F8 一 00FF; 


2) 0100 一 167F，1681 一 180D，180F 一 1FFF; 


3) 200B 一 200D，202A 一 202E，203F 一 2040，2054，2060 一 
206F ; 


4) 2070 一 218F，2460 一 24FF，2776 一 2793，2C00 一 2DFF，2E80 


一 2FFF; 
5) 3004 一 3007，3021 一 302F，3031 一 303F; 
6) 3040 一 D7FF; 
7) F900~FD3D, FD40~FDCF, FDFO~FE44, FE47~FFFD:; 


8) 10000 一 1FFFD，20000 一 2FFFD，30000 一 3FFFD，40000 一 


4FFFD，250000 一 5FFFD，60000 一 6FFFD，70000 一 7FFFD，80000 一 
8FFFD, 90000~9FFFD, A0000~AFFFD, BO000~BFFFD, C0000~ 
CFEFFD, DOO000~DFFFD, E0000~EFFED. 


此 外 ， 标 识 符 的 第 一 个 通用 字符 名 不 能 落 在 以 下 范围 内 : 0300 一 
036F, 1DCO0~1DFF, 20D0~20FF, FE20~FE2F。 








在 C 语 言 标准 中 没有 特别 设 定 一 个 标识 符 的 最 大 长 度 。 不 过 有 具体 的 
C 语 言 实现 可 以 根据 目 己 的 情况 设 定 标识 符 最 大 长 度 。 








在 同一 作用 域 《scope) 内 ， 一 个 标识 符 应 该 指定 一 个 确切 的 实 
体 。 如 果 编 译 喜 在 当前 上 下 文中 无 法 判定 某 个 标识 符 用 于 引用 哪个 实 
体 ， 那 么 就 会 发 生 编 译 错误 。 关 于 作用 域 的 详细 介绍 请 参见 11.1 节 。 


4.2.2 C 语 言 中 的 关键 字 





在 编程 语言 中 所 谓 的 “关键 字 ”(keyword) 是 指 被 编程 语言 编译 器 
保留 用 作 特 定语 义 的 token， 它 们 不 能 被 程序 员 当 作 其 他 标识 符 来 使 
用 。C11 标 准 中 的 关键 字 见 表 4-1。 


表 4-1 ”C11 标准 中 的 关键 字 


关键 字 可 用 的 C 语言 标准 


auto 自动 存储 类 说 明 符 C90 
break 循环 与 选择 分 支 的 退出 语 乌 C90 








case 选择 语句 块 中 的 case 语句 C90 
char 字符 类 型 C90 


const 常量 类 型 限定 符 C90 
continue 循环 中 跳 过 当前 迭代 C90 





关键 字 
default 默认 条 件 的 case 





do 与 while 语句 连用 ， 引 出 循环 语句 块 
double 双 精 度 浮 点 类 型 
else 其 他 条 件 的 分 支 


enum 

extem 

float 单 精度 浮 点 类 型 

for 引出 for 循环 语句 

goto 

if 
g 型 





inline 内 联 函 数 说 明 符 
int 
long 长 整数 类 型 








register 寄存 器 存储 类 说 明 符 

restrict 访 存 模式 受 限 的 指针 类 型 限定 符 

return 
short 短 整 数 类 型 

signed 


sizeof 获取 类 型 与 对 象 大 小 操作 符 


static 静态 存储 类 说 明 符 





struct 结构 体 类 型 说 明 符 
switch 
typedef 类 型 定义 存储 类 说 明 符 


union 联合 体 类 型 说 明 符 
无 符 





unsigned 

void 无 类 型 

volatile 易 变 存储 对 象 的 类 型 限定 符 

while 引出 while 循环 语句 

_Alipnas 

_Alignof 

_Atomic 

_Complex 

_Generic 
本 江上 





_Imaginary 虚数 类 型 说 明 符 
_Noreturn 无 返回 函数 说 明 符 
_Static_assert 


_Thread_local 线程 本 地 私有 存储 类 说 明 符 





( 续 ) 
可 用 的 C 语言 标准 
C90 
C90 
C90 
C90 
C90 
C90 
C90 
C90 
C90 
C90 
C99 
C90 
C90 
C90 
C99 
C90 
C90 
C90 
C90 
C90 
C90 
C90 
C90 
C90 
C90 
C90 
C90 
C90 
Cll 
Cll 
Cll 
C99 
C99 
Cll 
C99 
Cll 
Cll 
Cll 





在 上 述 关 键 字 中 有 些 是 由 大 写 、 小 写 以 及 下 划 线 混合 组 成 的 ， 各 位 
在 编写 代码 的 时 候 需 要 注意 大 小 写 。 这 些 关 键 字 会 从 第 5 章 开 始 分 别 进 


行 介绍 。 








看 到 以 上 这 些 关 键 字 读者 可 能 会 感到 奇怪 ， 为 何 有 些 关 键 字 是 以 下 
划 线 打头 的 呢 ? 以 下 划 线 打头 的 关键 字 均 是 从 C99 标 准 开始 引入 的 。 由 
于 在 C99 之 前 ， 有 不 少 C 语 言 编译 器 已 经 对 C99 标 准 新 引入 的 特性 给 予 文 
持 ， 为 了 防止 C99 标 准 的 关键 字 与 一 些 编译 器 已 有 的 扩展 关键 字 冲 突 ， 
从 而 通过 以 下 划 线 作为 前 级 ， 然 后 首 字 母 大 写 来 定义 这 些 关 键 子 。 而 通 
过 C 语 言 新 标准 引入 新 的 标准 库 可 使 得 这 些 关 键 字 能 被 统一 。 











所 以 ， 大 家 在 使 用 以 下 划 线 打头 的 关键 字 时 ， 请 尽量 先 引 入 相应 的 
标准 库 头 文件 ， 然 后 使 用 非 下 划 线 形式 的 相应 关键 字 。 比 如 ， 
<stdbool.h> 头 文件 中 将 _Bool 类 型 定义 为 了 bool 类 型 ，<complex.h> 头 文 
件 中 将 _Complex 定 义 为 了 complex， 等 等 。 我 们 最 好 使 用 bool、complex 
来 代 符 _Bool 和 _Complex， 这 样 一 来 书写 更 为 简洁 ， 二 来 又 有 更 好 的 回 
前 兼容 以 及 跨 平 台 等 特性 。 当 然 ， 还 有 一 些 关 键 字 是 没有 相应 标准 库 定 
义 形 式 的 ， 比 如 _Generic， 我 们 在 使 用 的 时 候 直 接 用 _Generic 即 可 。 




















4.2.3 “C 语 言 中 的 常量 与 字符 串 字 面 量 


C 语 言 中 ， 常 量 (contant) 有 4 种 ， 分 别 是 整数 常量 、 浮 点 数 常 量 、 





枚 举 第 量 以 及 字符 常量。 每 个 常量 都 具有 一 个 特定 的 类 型 以 及 该 第 量 所 
指定 的 值 ， 御 量 值 必须 在 其 类 型 所 能 表示 的 范围 内 。 人 整数 利和 量 和 字符 向 
量 将 在 5.1 节 中 描述 ， 浮 点 数 常 量 将 在 5.2 贡 中 描述 ， 枚 举 帝 量 将 在 6.1 贡 


描述 。 








字符 串 字 和 面 量 我 们 之 前 已 经 见 过 了 ， 图 4-1 中 的 u8“Hello，worldn 你 
好 ， 世 界 ! ?就 是 一 个 字符 串 字 面 量 。 在 C11 中 ， 一 个 字符 串 字 面 量 由 一 
对 双 引 号 包 庄 的 一 系列 的 字符 构成 。 如 果 字 符 串 中 含有 诸如 回 车 、 双 引 
号 等 字符 的 话 ， 需 要 对 它们 进行 转 义 ， 转 义 字 符 将 在 5.1.6 节 中 描述 
外 ， 字 符 串 的 第 一 个 双 引 号 前 可 以 加 u8、u 和 U 这 三 种 前 级 。u8 指 定 了 
该 字符 串 字 面 量 是 一 个 UTF-8 字 符 串 ; u 表 示 该 字符 串 字 面 量 是 一 个 
UTF-16 字 符 串 ; U 表 示 该 字符 串 字 面 量 是 一 个 UTF-32 字 符 串 。 如 果 不 加 
前 级 ， 则 默认 为 当前 系统 实现 的 字符 编码 格式 。 字 符 串 字面 量 将 在 7.10 
节 做 进一步 描述 








4.2.4 ”CC 语言 中 的 标点 符号 


CC 语言 百 的 标 et 符号 如 下 : 


i 


/ % << >> < > <= >= 


<: :> <% %> %: %: %: 


标点 符 写 是 具有 独立 语法 和 语义 意义 的 符 写 。 它 作为 一 个 要 执行 的 
操作 时 ， 又 称 为 操作 符 (operator) 。 操 作 符 所 作用 的 实体 称 为 操作 数 
Coperand) 。 比 如 ，3+2 这 个 表达 式 中 ，+ 是 一 个 操作 符 ， 表 示 整 数 加 
法 操作 。 而 3 和 2 则 是 + 的 操作 数 ，3 作 为 + 的 左 操作 数 ，2 作 为 + 的 右 操 作 
数 。 








上 述 列 出 的 标点 符号 中 ， 有 些 无 法 单独 成 为 一 个 操作 符 ， 比 如 
[、]，《《、) 等 ， 而 是 希 要 将 它们 组 合 起 来 [ ]、〈 ) 才 行 。 而 在 
〈《 ) 操作 符 里 边 的 表达 式 则 作为 该 操作 符 的 操作 数 。 比 如 : 《〈3+2) 
的 操作 数 是 表达 式 3+2。 此 外 ， 有 些 标点 符号 可 进行 组 合 形 成 一 个 操作 
符 ， 比 如 <<、+=、>>= 等 。 这 些 组 合 标点 符号 之 间 不 允许 带 有 空白 符 ， 


比如 << 表 示 左 移 操作 ， 而 < < 仅仅 表示 两 个 小 于 号 。 








C 语 言 中 ， 操 作 符 按照 可 作用 的 操作 数 个 数 来 分 可 分 为 单 目 操作 符 
(unary operator) 、 双 目 操作 符 〈binary operator) 和 三 目 操作 符 


(ternary operator ) 。 


1) 单 目 操作 符 有 ! (表示 逻辑 非 》、&&〈 用 作 地 址 操作 符 时 )、 
* 《作为 间接 操作 符 时 ) 、+ (表示 正 数 符号 时 ) 、- 表示 负数 符 写 
时 ) 、~《 表 示 按 位 取 反 ) 。 


2) 双 目 操作 符 有 ++《 表 示 目 增 操 作 ) 、--《〈 表 示 目 减 操作 ) 。 


3) 三 目 操作 符 只 有 一 组 ， 即 ? 与 : 的 组 合 ， 作 为 条 件 表 达 式 的 操 
作 符 ， 这 将 在 8.2 节 中 详细 描述 。 


其 余 的 ， 除 了 # 和 样 作为 预 处 理 操作 符 之 外 ， 上 述 列 出 的 操作 数 中 
都 是 双 目 操作 符 。 


不 同 的 操作 符 可 能 会 有 不 同 的 计算 优先 次 序 。 在 计算 一 个 表达 式 
时 ， 如 果 该 表达 式 含有 多 个 操作 符 ， 那 么 这 些 操 作 符 按照 优先 级 局 的 先 
开始 计算 ， 然 后 再 计算 低 优 先 级 的 操作 。 如 果 几 个 操作 符 具 有 相同 优先 
级 ， 那 么 按照 从 左 到 右 的 顺序 依次 计算 。 在 C11 标 准 中 定义 了 如 下 表达 
式 的 计算 优先 次 序 ， 排 列 从 高 到 低 。 











1) 基本 表达 式 : 标识 符 、 常 量 、 字 符 串 字面 量 、 圆 括号 表达 式 
(比如 〈3+2) ) 、 泛 型 表达 式 。 


2) 后 级 操作 符 ， 数组 下 标 ( 比 如 a[0]〉、 函 数 调用 、 结 构 体 与 联合 
体 成 员 访 问 操作 符 〈. 和 ->〉、 后 级 上 自 增 及 上 自 减 操作 和 从 (比如 a++; a- 


-) 、 复合 字面 量 《比如 Cint[]7 {1y 3} sw 





3) 单 目 操作 符 : 前 级 目 增 与 日 减 操作 符 、 地 址 操作 符 与 间接 操作 


符 《〈 比 如 ++a; --a) 、 单 目 算 术 操 作 符 (+、-、! 
表示 正 负 号 ) 、sizeof 操 作 符 与 _Alignof 操 作 符 。 


4) 类 型 投 冉 操 作 符 ( 详 见 5.6 节 〉。 


、 人 个 ， 其 中 这 里 的 + 和 - 


5) 乘法 操作 符 ( 包 括 乘 、 除 、 求 余数 *、/、%) 。 


6) 加 法 操作 符 (+、-) 。 


7) 移 位 操作 符 《〈 左 移 、 右 移 ) 。 


8) 关系 操作 待 〈 大 于 、 小 于 、 大 于 等 于 、 小 于 等 于 ) 。 


9) 相等 性 操作 符 《〈 等 于 和 不 等 于 ，==、! =) 。 


10) 按 位 与 操作 符 。 


11) 按 位 异 或 操作 符 。 


12) 按 位 或 操作 符 。 


13) 逻辑 与 操作 符 。 


14) 逻辑 或 操作 符 。 


15) 条 件 操作 符 〈 即 三 目 表 达 式 ) 。 


16) 赋值 操作 符 。 


17) 运 号 操作 符 。 


下 面 举 一 个 简单 的 例子 : 





int a=3+2*10/4--(3 - 2); 





上 述 代 码 中 ， “(3-2) 最 先 被 计算 得 到 结果 1， 然 后 再 计算 - (1) 的 
结果 是 -1， 然 后 计算 2*10 的 结果 等 于 20， 再 计算 20/4 的 结果 等 5， 再 是 
3+5 的 结果 等 于 8， 然 后 是 8-(-1) 的 结果 是 9， 最 后 是 将 结果 9 赋值 给 变 


do 














地 ln 


4.3 关于 C 语 言 中 的 “对 象 ” 


CI11 标 准将 “对 象 ” 定 义 为 执行 环境 中 的 数据 存储 区 域 ， 对 象 中 的 内 
容 用 于 表达 和 它 的 值 。 当 引用 了 某 一 对 象 时 ， 该 对 象 就 可 称 为 具有 一 个 特 
定 类 型 。 言 下 之 意 ，C 语 言 标准 中 的 “对 象 ”" 是 指数 据 实 体 ， 而 不 是 一 个 
函数。 此 外 ， 它 具有 一 个 特定 的 存储 区 域 ， 无 论 是 在 寄存 器 中 还 是 在 存 


储 器 中 。 男 外 ， 它 具有 一 个 特定 的 类 型 。 














C 语 言 不 是 一 门面 同 对 象 的 编程 语言 ， 所 以 这 里 的 “对 象 ” 与 面向 对 
象 编程 语言 所 涉及 的 对 象 概 念 有 些 差 别 ， 不 过 从 范围 上 来 讲 ， 这 里 
的 “对 象 ? 比 面 癌 对 象 中 的 对 象 范围 更 广 。 从 总 体 上 将 对 象 进 行 划分 可 分 
为 两 大 类 一 一 变量 和 常量 。 


变量 是 指 在 程序 运行 时 ， 人 允许 该 对 象 所 存放 的 值 被 修改 。 


第 量 是 指 在 程序 运行 时 ， 该 对 象 所 存放 的 值 不 允许 个 修改 。 





在 C 语 言 实现 中 ， 常 量 可 以 被 写 入 ROM， 尤 其 对 于 骨 入 式 设备 而 
， 更 有 可 能 如 此 。 这 样 ， 一 旦 对 录 个 常量 对 象 进行 修改 ， 那 么 系统 会 
直接 发 出 异 第 。 而 在 通用 蜗 面 操作 系统 中 ， 常 量 也 被 分 配 在 RAM 中 ， 
所 以 我 们 仍然 可 以 通过 类 型 转换 或 是 其 他 奇 技 淫 巧 对 常量 对 象 进行 修 
改 ， 不 过 后 果 是 无 法 预 估 的 。 








ll 














在 计算 机 编程 语言 中 还 有 一 个 比较 常见 的 概念 就 是 字面 量 。 在 传统 
编程 语言 中 ， 字 面 量 就 是 指 在 源 代 码 中 用 于 表示 一 个 固定 值 的 文字 记 








与 
比如 ， 像 3、-10、3.14、"hello" 等 都 属于 字面 量 。 
其 中 : 
-3、-10 表 示 整 数字 面 量 。 
:3.14 表 示 浮 点 数字 面 量 。 
"hello" 表 示 一 个 字符 串 字 面 量 。 


这 些 字面 量 往往 都 是 常量 ， 而 像 一 般 的 整数 字面 量 在 概念 上 我 们 也 
无 需 关 心 它 到 底 是 不 是 一 个 对 象 ， 即 不 需要 关心 它 有 没有 自己 的 存储 空 
间 。 由 于 字面 量 以 及 像 (3+2) 等 常量 表达 式 是 在 编译 时 就 能 计算 出 结 
打 的 ， 所 以 对 于 这 些 字 面 量 的 算术 逻辑 计算 也 无 需 在 程序 运行 时 体现 出 


来 。 

















另外 ，C11 还 包括 了 结构 体 、 联 合体 以 及 数组 的 复合 字面 量 。 这 些 
合 字面 量 无 需 是 常量 ， 而 且 它 们 自己 所 包含 的 元 素 也 完全 可 以 是 变 
量 ， 并 且 在 运行 时 也 完全 可 被 修改 。 




















4.4 C 语 言 中 的 “副作用 ” 





在 很 多 编程 语言 中 都 会 提 到 “副作用 ”(side effects〉 这 个 概念 。 在 
C11 标 准 中 对 副作用 是 这 么 描述 的 ， 对 一 个 易 变 对 象 的 访问 、 对 一 个 对 
象 的 修改 、 对 一 个 文件 的 修改 ， 或 调用 一 个 函数 ， 所 有 这 些 操作 都 具有 
副作用 。 副 作用 对 执行 环境 中 的 状态 做 了 改变 。 对 一 个 表达 陈 的 计算 通 
常 包含 了 对 值 的 计算 以 及 对 副作用 的 初始 化 。 对 一 个 左 值 表达 陈 的 值 计 
算 包含 了 判定 该 表达 式 所 表示 对 象 的 标识 。 


通常 来 讲 ， 所 谓 副作用 就 是 在 C 源 代码 中 的 某 一 条 表达 式 在 目标 程 
序 中 执行 时 ， 对 当前 程序 的 执行 状态 产生 了 或 潜在 产生 改变 ， 那 么 我 们 
称 该 表达 式 产 生 了 副作用 。 所 谓 程 序 执行 状态 包含 了 许多 元 素 ， 比 如 对 
目标 程序 指令 、 寄 存 器 的 值 、 存 储 器 中 的 数据 等 。 





4.5  C 语 言 标 准 库 中 的 printf 函 数 


我 们 这 里 先 简单 介绍 一 下 本 书后 续 会 大 量 使 用 的 控制 台 字 符 串 输出 
函数 printf。 这 是 一 个 C 语 言 标准 库 函 数 。printf 函 数 的 原型 为: 





int printf(const char * restrict format, ...); 





此 函数 第 一 个 参数 format 是 一 个 字符 串 格式 符 ， 后 面 的 省 略 号 表示 
不 定 个 数 的 参数 ， 这 些 参数 的 数据 类 型 需要 分 别 与 format 所 指向 的 字符 
串 中 的 格式 匹配 。 函 数 最 后 返回 的 是 一 个 int 类 型 整数 ， 表 示 被 传递 到 控 
制 台 的 字符 的 个 数 。 如 果 输 出 或 者 字符 串 编码 发 生 错误 ， 那 么 该 函数 将 
返回 一 个 负 值 。 但 当前 大 部 分 编译 器 的 实现 并 非 返回 传递 到 控制 台 的 字 
符 个 数 ， 而 是 字 节 个 数 ， 这 对 输出 UTF-8 编 码 的 字符 串 时 尤为 如 此 。 





下 面 简单 介绍 一 下 本 书 中 币 用 的 format 字 符 串 中 的 格式 符 。 


1) %c: 对 应 参数 是 一 个 int 类 型 ， 但 实际 运行 时 会 将 该 int 类 型 对 象 


转换 为 unsigned char 类 型 。 
2) %d: 对 应 参数 是 一 个 int 类 型 。 
3) %f: 对 应 参数 是 一 个 double 类 型 。 


4) %ld: 对 应 参数 是 一 个 long int 类 型 。 


5) %s: 对 应 参数 是 一 个 const char* 类 型 ， 表 示 输 出 一 个 字符 串 。 
6) %u: 对 应 参数 是 一 个 unsigned int 类 型 。 

7) %zu: 对 应 参数 是 一 个 size_t 类 型 。 

8) %td: 对 应 参数 是 一 个 ptrdiff t 类 型 。 


9) %xX (或 %X) : 对 应 参数 是 一 个 int 类 型 ， 不 过 会 以 十 六 进 制 形 
式 输出 ， 其 中 大 于 9 的 数字 根据 字母 x 大 小 写 进行 转换 ， 如 果 是 %x， 则 
大 于 9 的 数 用 a~f 表 示 ; 如 果 是 %X， 则 用 A 一 表示 。 





10) %%: 输出 一 个 % 符 号 。 


各 位 可 以 在 自己 的 计算 机 上 洽 试 编写 下 列 代码 ， 熟 悉 一 下 pritnf 函 
数 的 使 用 方式 : 





#include <stdio.h> 
#include <math.h> 


int main(int argc, const char * argv[]) 


int len = printf(" 你 好 \n"); 

printf(" 长 度 为 : %d\n"，1en); 

printf(" 输 出 字符 是 :%c， 输 出 浮 点 数 是 : %f\n"，'A'，M_PI); 
printf("100 的 十 六 进 制 数 为 : 90x%XNn"，100 ) ; 




















const char *s = "hello, world!" 
printf(" 几 乎 00% 会 ! 出 现在 编程 语言 教科 书 上 的 字符 串 是 : %s\n"，s); 























各 位 可 以 编译 运行 上 述 代码 。 如 果 各 位 在 某 些 Unix/Linux 上 实践 ， 
没有 中 文 输入 法 也 没有 关系 ， 可 以 用 相应 的 英文 来 代替 上 述 中 文 。 另 


外 ， 上 述 字 符 串 中 所 出 现 的 n 是 一 个 转 义 字符 ， 关 于 转 义 字符 ， 我 们 将 
在 5.1.6 节 中 加 以 描述 。 


4.6 ”本 章 小 结 





本 章 我 们 大 概 描述 了 C 语 言 构 成 的 基本 元 素 。 一 开始 ， 我 们 列 出 了 
一 个 完整 的 C 语 言 源 文 件 应 该 包含 的 几 个 部 分 。 然 后 我 们 提 到 了 C 语 言 
中 的 可 用 字符 集 以 及 各 类 符号 与 它们 的 定义 。 关 于 C 语 言 执行 环境 限制 
的 更 多 详细 信息 可 参考 此 博文 : http://www.cnblogs.com/zenny- 
chen/p/4251813.html。 


通过 本 章 学 习 ， 各 位 应 该 已 经 能 体会 到 C 语 言 书 写 的 大 致 格式 ， 并 


且 通 过 本 章 列 出 的 一 些 代码 片段 ， 目 己 能 试 试 身 手写 一 些 简 单 短小 的 代 
码 出 来 ， 然 后 利用 printf 函 数 可 以 打印 出 一 些 计算 结果 。 


第 5 草 ” 基 本 数据 类 型 





本 章 将 介绍 C 语 言 中 的 基本 数据 类 型 以 及 相关 的 算术 逻辑 运算 。C 
语言 中 的 基本 数据 分 为 两 大 类 ， 一 类 是 整数 类 型 ， 另 一 类 是 浮 点 类 型 。 
整数 类 型 还 包括 字符 类 型 以 及 布尔 类 型 。 浮 点 数 类 型 包括 单 精 度 浮 点 
数 、 双 精度 浮 点 数 以 及 扩展 双 精 度 浮 点 类 型 。 











对 任 一 整数 对 象 和 浮 点 数 对 象 ， 我 们 都 能 用 +、-、*、/ 对 它们 做 
加 、 减 、 乘 、 除 算术 运算 操作 ， 当 然 做 除法 时 除数 不 能 为 零 ， 否 则 会 导 
致 程序 运行 时 异常 。 男 外 ， 对 于 整数 之 间 的 操作 还 能 使 用 %( 求 模 操 
作 ) 进行 求 余 数 ， 比 如 5%2 的 结果 为 1， 但 浮 点 数 之 间 不 能 进行 求 模 操 
作 。 我 们 还 能 对 整数 做 按 位 操作 以 及 移 位 操作 ， 同 样 这 些 操 作 不 文 持 浮 
扩 数 。 





5.1 整数 类 型 


C 语 言 中 整数 类 型 包括 int、short、long、long long、 布 尔 、 字 符 
等 ， 除 了 字符 与 布尔 类 型 以 外 ， 其 他 所 有 整数 类 型 都 支持 带 符号 与 无 符 
写 的 表示 方式 。 关 于 带 符号 与 无 符 写 整数 类 型 的 表示 方式 可 以 参考 第 2 
章 的 内 容 。 此 外 ，C 语 言 标 准 中 没有 明确 规定 每 一 种 整数 类 型 所 占用 的 
字 节 数 ， 这 些 全 都 是 由 C 语 言 的 实现 来 定义 的 ， 但 是 C 语 言 标准 给 了 知 
干 约束 ， 所 以 C 语 言 实现 应 该 至 少 能 满足 这 些 约束 。 为 了 方便 用 述 ， 我 
们 这 里 仍然 根据 主流 桌面 端 编译 器 (GCC、Clang) 以 及 主流 32 位 与 64 
位 处 理 器 环境 的 实现 进行 讲解 。 























5.1.1 int 类 型 


用 关键 字 int 声 明 的 一 个 整数 对 象 具 有 int 类 型 。 在 具体 的 C 语 言 执 行 
环境 中 ，int 数 据 的 最 小 值 与 最 大 值 分别 定 义 为 <limits.h> 头 文件 中 的 
INT_MIN 和 INT_MAX。 在 我 们 利用 的 32 位 与 64 位 环境 中 ，int 默 认为 是 
带 符号 的 (相当 于 signed int) ， 占 用 4 个 字 节 〈 即 32 位 ) ， 其 最 小 值 
为 -231〈 即 0x80000000) ， 最 大 值 为 231-1 〈 即 0x7FFFFFFF) 。int 所 对 应 
的 无 符号 类 型 是 unsigned int， 通 常 在 32 位 与 64 位 环境 下 也 占用 4 个 字 


节 ， 最 小 值 为 0， 最 大 值 为 232-1 ( 即 0xFFFFFFFF) 。 在 具体 C 语 言 执行 











环境 中 的 最 大 值 定 义 为 <limits.h> 头 文件 中 的 UINT_MAX。 








int 类 型 对 应 的 整数 字面 量 可 直接 按照 自然 方式 书写 ， 比 如 
0、-128、127、+2233 等 都 默认 表示 为 int 类 型 。 此 外 ， 整 数字 面 量 可 以 
分 别 使 用 八进制 、 十 进 制 以 及 十 六 进 制 的 方式 进行 表达 。 八 进 制 的 整数 
字面 量 表达 方式 为 以 0 打头 ， 比 如 : 01、023、-0477 这 些 都 是 属于 八 进 
制 整 数字 面 量 。 而 十 六 进 制 整数 字面 量 则 是 以 0x 或 0X 打 头 ， 比 如 : 
0x123、-0x0045、0xabcdef 这 些 都 是 有 效 的 十 六 进 制 整数 字面 量 。 而 其 
他 没有 任何 前 级 的 整数 字面 量 都 表示 为 十 进 制 整数 。 如 果 想 要 表达 一 个 
unsigned int 类 型 的 整数 字面 量 ， 可 在 一 般 整 数字 面 量 后 直接 添加 字母 u 
或 U。 本 书 习惯 上 使 用 大 写 的 U。 比 如 0U、01U、-128U、2048U、 
+2233U 等 都 属于 unsigned int 类 型 。 当 然 ， 即 便 字面 量 后 面 不 加 U 后 级 ， 
这 些 数 也 能 赋值 给 unsigned int 类 型 的 对 象 ， 因 为 它们 会 被 编译 器 进行 默 
认 转 换 。 此 外 ， 当 我 们 要 声明 一 个 unsigned int 类 型 的 对 象 时 ，int 可 以 省 
略 。 比 如 ，unsigned a=0; ， 其 中 对 象 a 的 类 型 即 为 unsigned int 类 型 ，= 
是 一 个 赋值 操作 符 (assignment operators) ， 将 其 右 操作 数 0 赋值 给 左 操 
作 数 a。 下 面 举 一 些 例子 ， 各 位 也 可 以 在 自己 的 计算 机 上 试 试 ， 如 代码 
清单 5-1 所 示 。 











代码 清单 5-1 int 类 型 介绍 





#include <stdio.h> 
#include <limits.h> 


int main(int argc, const char * argv[]) 


int a = 10; // 声明 了 int 类 型 对 象 a， 并 且 将 整数 10 赋 值 给 它 
// 以 下 语句 声明 了 unsigned int 类 型 对 象 b， 并 且 将 整数 100 赋 值 给 它 
unsigned int b = +100U; 



























































unsigned c = -1U; // 声明 了 unsigned int 类 型 对 象 c 

printf("a + b = %d\n", a + b); // 这 里 a+b 的 结果 为 110 

printf("c = Ox%X\n", c); // 这 里 ，c 为 OxFFFFFFFF 

printf("a + c = %d\n", a + c); // 这 里 加 法 结果 溢出 ， 但 可 将 它 看 作为 10-1 的 结果 





























a = Qx7FFFFFFF; 
a += 1; // a += 1 相当 于 a = a + 工 
printf("a = %d\n"，a);// 加 法 结果 溢出 ， 结 果 为 -2147483648， 相 当 于 0Qx80000000 























%d\n"，INT_MIN); // 查看 当前 Cc 语言 实 现下 int 类 型 的 最 小 人 


printf("INT_MIN 
%d\n"，INT_MAX); // 查看 当前 C 语 言 实现 下 int 类 型 的 最 大 人 


printf("INT_MAX 








TH (I 











// 查看 当前 C 语 言 实 现下 unsigned int 类 型 的 最 大 值 
// 由 于 unsigned int 的 最 小 值 已 被 标准 定义 为 0 
printf("UINT_MAX = %u\n", UINT_MAX); 
































这 里 顺便 再 提 一 下 ， 根 据 C 语 言 标 准 ， 我 们 在 一 个 C 语 言 源 文件 的 
末尾 处 最 好 添加 一 个 换行 符 ， 并 且 不 再 添加 任何 其 他 的 空白 符 。 在 茶 些 
老 版 本 的 GCC 上 比如 3.x 版 本 ) ， 如 果 源 文件 末 不 是 以 换行 符 结尾 
则 GCC 编 译 嚣 在 编译 后 会 有 警告， 要 求 在 源 文件 末尾 处 添加 一 个 换行 


符 

















上 述 代 码 已 经 涉及 了 很 多 额外 的 知识 ， 比 如 加 减法 运算 结果 溢出 的 
行为 ， 还 有 += 操 作 符 的 意义 等 。 由 于 这 些 知 识 比 较 简 单 易 懂 ， 所 以 我 们 
束 不 在 正文 中 加 以 闭 述 ， 而 直接 以 代码 注释 的 方式 给 出 。 各 位 在 目 己 的 
计算 机 上 编译 运行 后 自然 就 能 知晓 其 用 途 。 当 然 ， 各 位 在 融 上 述 代 码 的 
时 候 ， 注 释 部 分 VW/ 以 及 其 后 面 的 文字 ) 不 需要 打出 来 ， 这 些 仅仅 是 对 
代码 的 注解 ， 对 程序 本 身 没 有 其 他 作用 。 








5.1.2 ”short 类 型 


short 类 型 〈 标 准 表 达 为 signed short int 类 型 ， 其 中 signed 与 int 均 可 省 
略 ) 我 们 一 般 称 之 为 短 整 型 。 在 我 们 通常 的 32 位 及 64 位 系统 下 占用 2 个 
字 节 〈 即 16 位 ) ， 其 最 小 值 为 -225 〈 即 0x8000) ， 最 大 值 为 25-1( 即 
0x7FFF) 。 在 C 语 言 执 行 环境 下 ， 其 最 大 、 最 小 值 分 别 定义 为 <limits.h> 
头 文件 中 的 SHRT_MAX 和 SHRT_MIN 。short 类 型 所 对 应 的 无 符号 类 型 
为 unsigned short (标准 表达 为 unsigned short int， 其 中 int 可 省 ) 。 它 通常 
在 32 位 及 64 位 系统 下 占 2 个 字 节 ， 最 小 值 为 0， 最 大 值 为 22-1《〈 即 
0xFFFF) 。 在 C 语 言 执 行 环境 中 ， 其 最 大 值 定 义 为 <limits.h> 头 文件 中 的 
USHRT_MAX。 


























short 类 型 与 unsigned short 类 型 没有 特别 对 应 的 整数 字面 量 ， 它 们 可 
直接 用 int 与 unsigned int 相 应 的 整数 字面 量 进行 赋值 ， 如 代码 清单 5-2 所 
示 的 用 法 。 


代码 清单 5-2 ”short 类 型 介绍 





#include <stdio.h> 
#include <limits.h> 


int main(int argc, const char * argv[]) 











// 这 里 同时 声明 了 short 类 型 对 象 a 和 b 
// 并 且 将 a 赋 值 为 100，b 赋 值 为 200 
Short a = 100, b = 200; 









































printf("a - b = %d\n", a - b); 

















// 这 里 声明 了 unsigned short 类 型 的 对 象 c 
unsigned Short c = 100; 
c -= 200; // 相当 于 c = c - 200; 





printf("c = %hu\n", c); // 结果 为 65436 ( 即 65536 - 100) 





printf("SHRT_MIN = %d\n"，SHRT_MIN);// 查看 当前 C 语 言 实 现下 short 类 型 的 最 小 值 
printf("SHRT_MAX = %d\n"，SHRT_MAX);// 查看 当前 Cc 语言 实 现下 short 类 型 的 最 大 值 





























// 查看 当前 C 语 言 实现 下 unsigned short 类 型 的 最 大 值 
// 于 unsigned short 的 最 小 ss 准 定义 为 
printf("USHRT_MAX = %u\n", USHRT_MAX); 









































代码 清单 5-2 中 ， 字 符 串 格式 符 %hu 对 应 一 个 unsigned short 类 型 的 参 
数 。65536 表 示 为 2"。 这 里 表述 了 第 2 章 介绍 的 概念 ， 即 如 何 将 一 
符号 整数 《〈 补 码 形式 ) 转 为 无 符号 整数 的 表示 形式 。 


5.1.3 long 类 型 


long 类 型 (标准 表达 为 signed long int 类 型 ， 其 中 signed 与 int 均 可 省 
略 ) 我 们 一 般 称 之 为 长 整 型 。 在 我 们 通常 的 32 位 环境 下 long 类 型 占用 4 
个 字 节 《〈 即 32 位 ) ， 而 在 64 位 系统 下 ， 当 前 几 个 主流 桌面 编译 器 就 有 所 
区 别 了 。MSVC 与 VS-Clang 仍 然 为 4 个 字 节 ， 而 GCC 与 Clang 则 是 8 个 字 
节 《 即 64 位 ) 。long 类 型 所 对 应 的 无 符号 类 型 为 unsigned long〈 标 准 表 
达 为 unsigned long int，int 可 省 ) ， 我 们 一 般 称 之 为 无 符号 长 整 型 ， 它 的 
字 贡 长 度 与 jong 类 型 一 致 。 在 C 语 言 执 行 环 境 中 ，long 类 型 的 最 小 值 与 
最 大 值 分 别 定 义 为 <limits.h> 头 文件 中 的 LONG_MIN 与 LONG_MAX。 
unsigned long 类 型 的 最 大 值 定 义 为 <limits.h> 头 文件 中 的 ULONG_MAX， 
其 最 小 值 为 0。 


long 类 型 对 应 的 整数 字面 量 是 在 int 整 数字 面 量 后 面 加 上 英文 字母 或 
L， 本 书 都 用 大 写字 母 L 作 为 后 级 。unsigned long 对 应 的 整数 字面 量 是 在 








unsigned int 字 面 量 后 面 加 上 字母 或 L， 本 书 采 用 的 都 是 以 UL 作为 后 级 。 
一 般 情 况 下 ， 我 们 直接 用 int 字 面 量 赋值 给 long 类 型 的 变量 也 不 会 有 问 
题 ， 但 是 当 我 们 要 表达 一 个 超出 int 范 围 的 整数 时 ， 我 们 就 得 加 上 后 绥 
L， 和 否则 数据 可 能 会 被 截断 。 不 过 这 里 ， 不 同 的 编译 器 会 有 不 同行 为 。 
如 代码 清单 5-3 所 示 的 例子 。 





代码 清单 5-3 ”long 类 型 介绍 





#include <stdio.h> 
#include <limits.h> 


int main(int argc, const char * argv[]) 


{ 
long a = 100; // 声明 了 long 类 型 对 象 48， 并 给 它 赋 值 为 100 





























// 这 里 0x100000000 已 经 超出 了 一 般 int 的 范围 
// 所 以 我 们 在 它 后 面 加 上 后 级 L， 表 示 一 个 long 类 型 的 字面 量 | 
// 倘若 不 加 后 缀 L， 在 某 些 编译 器 上 会 出 现 警 告 ， 在 运行 时 也 可 能 出 现 数 据 被 截断 的 情况 
long b = 0x100000000L; 
















































































// 这 里 用 %1d 表 示 对 应 一 个 long 类 型 的 参数 
printf("a + b = %ld\n", a + b); 














// 声明 一 个 unsigned long 类 型 对 象 c 
// 100UL 即 表示 一 个 unsigned Long 的 整数 字面 上 
unsigned long c = 100UL; 




















tu 








// 声明 一 个 unsigned long 类 型 对 象 d 
// 1900009 表 示 一 个 int 类 型 的 整数 字面 
// 但 由 于 unsigned Iong 的 精度 至 少 不 小 于 int 类 型 的 业 度 ， 
// 所 以 int 可 以 隐 式 转 为 unsigned long 类 型 
unsigned long d = 1000000; 




































































// 这 里 用 %1lu 表 示 对 应 ns ig long 类 型 的 参数 
printf("c * d = %lu\n", c * d); 





%ld\n"，LONG_MIN);// 查看 当前 Cc 语言 实现 下 long 类 型 的 最 小 人 


printf("LONG_MIN 当 衣 
%ld\n"，LONG_MAX);// 查看 当前 C 语 言 实 现下 long 类 型 的 最 大 人 


printf ("LONG_MIN 


// 查看 当前 C 语 言 实 现 Funsigned long 类 型 的 最 大 什 
// 由 于 unsigned long 的 最 小 值 已 被 标准 定义 为 9 
printf("ULONG_MAX = %lu\n", ULONG_MAX); 











TH 区 










































































对 于 代码 清单 5-3， 我 们 最 好 在 64 位 的 Linux 或 macOS 〈 或 





FreeBSD) 下 用 GCC 或 Clang 编 译 器 编译 运行 ， 因 为 在 Windows 64 位 下 
用 MSVC 或 MS-Clang 编 译 器 的 话 ，long 类 型 仍然 占 4 个 字 节 ， 看 不 到 某 
些 效 果 ， 除 非 使 用 MingW-W64 或 64 位 的 Clang 编 译 器 。 


不 过 ， 正 因为 long 和 unsigned long 在 不 同 环境 下 字 节 长 度 不 同 ， 所 
以 我 们 在 定义 一 个 整数 对 象 时 应 当 尺 量 避 免 使 用 long 类 型 ， 除 非 涉及 系 
统 相 关 的 一 些 属性 。 比 如 C 语 言 标准 库 中 将 获取 文件 当前 位 置 (ftell) 
等 图 数 的 返回 类 型 作为 Iong 类 型 。 但 对 于 一 般 应 用 程序 而 言 ， 我 们 需要 


慎 用 long 类 型 。 





5.1.4 _ long long 类 型 


C 语 言 标准 对 long long 标准 表达 为 signed long long int， 其 中 signed 
与 int 可 省 ) 类 型 提 人 得 不 多 ， 仅 仅 前 述 了 long long 类 型 的 精度 至 少 为 long 
int 类 型 的 精度 。 不 过 在 当前 几 大 主流 泉 面 编译 器 中 ， 无 论 是 32 位 系统 还 
是 64 位 系统 ，long long 的 宽度 均 为 8 个 字 节 《〈 即 64 位 ) 。 其 最 小 值 
为 -2S， 最 大 值 为 23-1。long long 对 应 的 无 符号 类 型 为 unsigned long 
long (标准 表达 为 unsigned long long int，int 可 省 ) ， 同 样 也 是 8 字 节 的 
宽度 ， 最 小 值 为 0， 最 大 值 为 264-1。 在 C 语 言 执行 环境 下 ，long long 的 最 
小 值 与 最 大 值 分 别 定义 为 <limits.h> 头 文件 中 的 LLONG_MIN 与 
LLONG_MAX。unsigned long long 类 型 的 最 大 值 定义 为 <limits.h> 头 文件 





中 的 ULLONG MAX。 








long long 对 应 的 整数 字面 量 表示 为 int 整 数字 面 量 后 加 后 级 11 或 LL， 
本 书 采 用 LL 后 级 。unsigned long long 对 应 的 整数 字面 量 表示 为 unsigned 
int 整 数字 面 量 后 面 加 后 级 ll 或 LL， 本 书 采 用 ULL 作 为 后 级 。 参 见 代 码 清 
单 5-4。 





代码 清单 5-4 _ long long 类 型 介绍 





#include <stdio.h> 
#include <limits.h> 


int main(int argc, const char * argv[]) 








long long a = 100; // 声明 了 long long 类 型 对 象 4， 并 给 它 赋 值 为 100 























// 这 里 0x100000000 已 经 超出 了 一 般 int 的 范围 
// 所 以 我 们 在 它 后 面 加 上 后 绥 LL， 表 示 一 个 Long Long 类 型 的 字面 量 
long long b = Ox100000000LL; 









































// 这 里 用 %11d 表 示 对 应 一 个 long Long 类 型 的 参数 
printf("a + b = %]lld\n", a + b); 











// 声明 一 个 unsigned long long 类 型 对 象 c 
// 100ULL 即 表示 一 个 unsigned long long 的 整数 字面 昌 
unsigned long long c = 100ULL; 




















I 








// 声明 一 个 unsigned long long 类 型 对 象 d 
// 1000000 表 示 一 个 int 类 型 的 整数 字面 量 
// 但 由 于 unsigned long long 的 精度 至 少 不 小 于 int 类 型 的 精度 ， 
// 所 以 int 可 以 隐 式 转 为 unsigned long long 类 型 
unsigned long long d = 1000000; 







































































// 这 里 用 %11u 表 示 对 应 一 个 unsigned long long 类 型 的 参数 
printf("c * d = %llu\n", c * d); 


// 查看 当前 C 语 言 实 现下 long long 类 型 的 最 小 值 
printf("LLONG MIN = %lld\n", LLONG_MIN); 


// 查看 当前 C 语 言 实 现下 long long 类 型 的 最 大 值 
printf("LLONG MAX = %lld\n", LLONG_ MAX); 











// 查看 当前 C 语 言 实 现 Funsigned long long 类 型 的 最 大 值 
// 由 于 unsigned long long 的 最 小 值 已 被 标准 定义 为 9 
printf("ULLONG MAX = %llu\n", ULLONG_ MAX); 









































5.1.5 布尔 类 型 


在 计算 机 编程 语言 中 ， 布 尔 类 型 的 对 象 是 一 个 二 值 数据 对 象 。 布 尔 
类 型 用 于 表达 真 假 逻 辑 关 系 ， 一 般 用 true 表 示 真 ，false 表 示 假 。 产 生 布 
尔 值 的 表达 式 称 为 逻辑 表达 式 或 关系 表达 式 〈 比 如 ， 大 于 、 等 于 、 小 
于 、 不 等 于 等 关系 操作 的 结果 ) 。 在 C11 标 准 中 ， 布 尔 类 型 用 关键 字 
_Bool 声 明 ， 并 说 明 布 尔 类 型 只 要 能 够 存放 0 和 1 值 就 行 ， 也 就 是 至 少 为 1 
个 比特 。 所 以 现在 大 部 分 对 _Bool 的 C 语 言 实 现 都 将 它 作为 1 个 字 节 的 宽 
度 。 此 外 ，_Bool 类 型 不 能 用 signed 和 unsigned 来 修饰 。 





在 C 语 言 刚 被 创建 的 时 候 ， 它 并 不 具备 “布尔 类 型 ”这 个 概念 ， 而 仅 
仅 用 0 浮 点 数 则 为 0.0) 与 对 象 比较 来 判定 真 假 。 如 果 对 象 的 值 等 于 
零 ， 那 么 表示 “ 假 ”， 否 则 表示 “ 真 ”。 所 以 ， 即 便 从 C99 开 始 引入 了 _Bool 
布尔 类 型 ， 之 前 的 这 个 约定 依然 沿用 。 为 了 能 与 C++ 兼容 ，C 语 言 从 C99 
标准 开始 就 引入 了 <stdbool.h> 头 文件 ， 里 面 用 bool 这 个 宏 来 定义 _Bool， 
用 true 定 义 为 1，false 定 义 为 0。bool、true 以 及 false 都 不 属于 C 语 言 中 的 
关键 字 ， 它 们 仅 属 于 标准 库 中 定义 的 类 型 和 常量 。 在 C11 标 准 的 语言 核 
心中 ， 依 然 只 定义 了 _Bool 这 个 关键 字 表示 布尔 类 型 ， 而 没有 定义 真 值 
和 假 值 的 字面 量 。 所 以 ， 我 们 在 使 用 布尔 类 型 的 对 象 时 ， 最 好 引入 
<stdbool.h> 头 文件 ， 然 后 用 bool 定 义 布尔 类 型 对 象 ， 用 true 表 示 真 值 常 
量 ，false 表 示 假 值 常量 。 下 面 我 们 举 一 些 例子 来 说 明 。 




















代码 清单 5-5 布尔 类 型 介绍 





#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 


// 声明 了 一 个 布尔 类 型 的 对 象 a， 并 将 它 初始 化 为 真 


bool a = true; 


// 声明 了 一 个 布尔 对 象 bp， 并 将 它 初 始 化 为 假 
bool b = false; 


















































// 声明 了 es 并 | a 它 初 始 化 












































bool c = a == 这 里 c 为 假 
printf("c = a c); # 输出 c = 0 
Ce a = bs; // 用 a != b (a 不 等 于 b) 的 比较 结果 给 对 象 c 
ee b 的 结果 : %d\n"，c); // 输出 1 

c=10> 5; 

printf("10 > 5? %d\n", c); // 输出 1 
c= 10 < 5,; 

printf("10 < 5? %d\n", c); // 输出 0 
a = 0X10000000 ; 

printf("a = %d\n", a); // 输出 1 

b = 。 

ee = %d\n", b); // 输出 9 











// 输出 _Boo1 数 据 对 象 类 型 的 宽度 


printf("_Bool type Size is: %zuxn"，Sizeof(_Bool) )， 





在 代码 清单 5-5 中 ， 我 们 用 GCC 或 Clang 编 译 器 编译 之 后 能 发 现 ， 
_Bool 类 型 的 对 象 只 占用 一 个 字 节 。 另 外 ， 对 于 a=0x10000000，a 的 值 不 
是 简单 地 对 0x10000000 进 行 高 位 截断 ， 只 取 最 低 1 个 字 节 获得 结果 ， 而 
是 相当 于 将 0x100000001! =0 的 结果 给 了 布尔 对 象 a。 同 样 ， 下 面 的 b=0.0 
也 不 是 说 就 把 0.0 这 个 双 精 度 浮 点 数 赋值 给 布尔 对 象 p， 而 是 把 0.0! =0.0 
的 结果 赋值 给 布尔 对 象 b。 这 些 都 会 由 C 语 言 编译 器 自动 转换 处 理 。 


人 


5.1.6 ”字符 类 型 





C 语 言 中 用 关键 字 char 来 声明 一 个 字符 类 型 。C11 标 准 曾 明了 一 个 
char 类 型 的 对 象 必 须 至 少 能 存放 基本 执行 字符 集 ， 并 且 如 果 一 个 基本 执 
行 字符 存放 在 一 个 char 类 型 的 对 象 中 的 话 ， 那 么 该 char 类 型 的 对 象 的 值 
必须 保证 为 非 负 整数 。 所 以 ， 通 常 C 语 言 的 实现 都 会 将 char 类 型 的 宽度 
设置 为 一 个 字 节 ， 这 样 正好 至 少 能 存放 ASCII 码 字符 集 。 








这 里 各 位 需要 当心 的 是 ， 有 些 编译 器 会 默认 将 char 类 型 设 定 为 无 符 
号 的 ， 即 char 类 型 的 整数 是 一 个 无 符号 的 8 位 整数 。 所 以 ， 我 们 如 采 要 
用 char 类 型 定义 一 个 带 符号 的 8 位 整数 ， 需 要 显 式 地 使 用 signed char， 这 
里 signed 不 应 该 被 省 略 。 如 末 要 声明 一 个 无 符号 8 位 整数 ， 则 使 用 
unsigned char。C11 标 准 明确 指出 ，char、signed char 与 unsigned char 统 称 
为 字符 类 型 ， 但 三 者 在 类 型 上 是 不 兼容 的 ， 尽 管 char 在 数值 表示 范围 上 
可 能 与 unsigned char 相 同 ， 或 与 signed char 相 同 。 因 此 如 前 所 述 ， 我 们 在 
编写 程序 的 时 候 ， 用 signed char 来 指定 8 位 带 符号 整数 ，unsigned char 来 
指定 无 符号 8 位 整数 ，char 用 于 指定 一 个 基本 字符 对 象 。signed char 的 最 


大 、 最 小 值 分 别 定 义 为 <limits.h> 中 的 SCHAR_MAX 与 SCHAR_MIN。 














unsigned char 的 最 大 值 定 义 为 <limits.h> 中 的 UCHAR_MAX， 最 小 值 为 
0。char 的 最 大 、 最 小 值 分 别 定义 为 <limits.h> 中 的 CHAR_MAX 和 


CHAR_MIN。 

















8 位 市 符号 与 无 符号 的 整数 字面 量 没 有 特定 的 字面 量 表示 方式 ， 直 
接 用 int 与 unsigned int 类 型 的 整数 字面 量 即 可 。 而 字符 字面 量 则 是 用 单 引 
号 ， 里 面包 含 一 个 或 多 个 字符 。 比 如 'a、'123' 都 是 有 效 的 字符 字面 量 。 
C11 标 准 明 确 规定 ， 一 个 字符 字面 量具 有 int 类 型 ， 如 有 果 将 一 个 字符 字面 
量 赋 值 给 一 个 char 类 型 的 对 象 ， 那 么 将 该 字符 字面 量 的 最 低 有 效 位 赋值 
给 它 ， 比 如 在 我 们 通常 的 执行 环境 中 就 是 将 字符 字面 量 的 最 低 字 市 赋值 
给 char 类 型 的 对 象 。 















































在 C 语 言 中 ， 不 是 所 有 的 字符 字面 量 都 能 回 显 在 文本 编辑 器 中 ， 羽 
外 还 有 一 些 字符 具有 特殊 作用 ， 比 如 换行 、 制 表 符 等 ， 而 且 像 单 引 号 本 
喘 也 表示 一 个 字符 字面 量 的 开头 或 结尾 ， 所 以 对 于 这 些 特殊 字符 ， 我 们 
通过 使 用 转 义 字符 的 方式 来 表示 它们 。 下 面 列举 一 下 C 语 言 中 的 转 义 字 


大全 


符 。 








1) 单 引 号 : 用 \。 


2 又 引导 = 用 \'s 


3) 问号 : 用 \? ， 不 过 一 般 我 们 可 以 直接 使 用 '? '， 无 需 使 用 此 转 义 


ro 


字符 。 


4) 倒 斜 杠 \: 用 \\。 


5) 用 八进制 编码 表示 的 一 个 字符 : \ 后 面 紧 跟 1 到 3 个 八进制 数 。 比 


AN 3 


6) 用 十 六 进 制 编码 表示 一 个 字符 : \x 后 面 跟 一 个 十 六 进 制 数 。 比 
如 : \x0a、\x30 等 。 





Os 后面 所 眼 的 所 有 能 有 效 表示 为 十 六 进 制 数 的 字符 ( 妈 
0~~9， 大 写字 母 A~F 以 及 小 写字 母 a~f) 都 作为 当前 单个 十 六 进 制 编码 
的 字符 ， 直 到 遇 到 无 法 有 效 表示 十 六 进 制 数 的 字符 为 止 。 男 外 ， 如 果 \x 
后 面 不 是 紧 跟 一 个 有 效 的 十 六 进 制 字 符 ， 那 么 编译 此 将 会 报错 。 所 以 \x 
后 必须 至 少 跟 一 个 有 效 的 十 六 进 制 字符 。 


7) \a: 表示 报警 。 该 字符 会 产生 一 个 可 听 到 的 或 可 见 到 的 警报 ， 
但 不 改变 当前 的 游标 位 置 。 





8) \b: 表示 回 退 。 该 字符 将 当前 游标 移动 到 当前 行 的 前 一 个 位 


9) \f: 表示 换 页 。 访 字符 将 当前 游标 移动 到 下 一 个 逻辑 页 的 初始 位 





10) nn: 表示 换行 。 该 字符 将 当前 游标 移动 到 下 一 行 的 初始 位 置 。 


11) \r: 表示 回 车 。 该 字符 将 当前 游标 移动 到 当前 行 的 初始 位 置 。 


12) \t: 表示 水 平 制 表 符 。 该 字符 将 当前 游标 移动 到 当前 行 的 下 一 


个 水 平 表格 单元 位 置 。 








13) \v: 表示 垂直 制 表 符 。 该 字符 将 


单元 位 置 的 初始 位 置 。 





当前 游标 移动 到 下 一 垂直 表格 


14) \0: 表示 空 。 值 为 0 的 字符 在 C 语 言 中 一 般 用 于 字符 串 的 结束 


人 符 。C 语 言 标 准 库 中 的 很 多 库 函 数 都 以 \0 字 符 作为 一 个 字符 串 末 尾 的 判 


呆 依 据 。 


下 面 我 们 将 举 一 些 例子 来 描述 这 些 字 符 类 型 及 


代码 清单 5-6 





#include <stdio.h> 
#include <limits.h> 


eam 


字符 类 型 介绍 


int main(int argc, const char * argv[]) 





































































































signed char a = 100; // 声明 了 一 个 
signed char b = -10; // 声明 了 一 个 
printf("a - b = %d\n", a - b); // 结果 输出 110 
unsigned char c = 200; // 声明 了 一 个 
unsigned char d = 59; // 声明 了 一 个 
printf("c - d = %d\n", c - d); // 输出 结果 150 

// 输出 signed char 的 最 小 值 

printf("SCHAR_MIN = %d\n", SCHAR_MIN); 

// 输出 signed char 的 最 大 值 

printf("SCHAR MAX = %d\n", SCHAR_MAX); 

// 输出 unsigned char 的 最 大 什 

printf("UCHAR MAX = %d\n", UCHAR_ MAX); 

char ch = 'a'; // 声明 一 个 字符 对 象 ch， 
printf("ch = %c\n", ch); // 输出 a 

// 对 于 多 字符 的 字符 字面 量 ， 某 些 编译 器 会 给 出 警告 

// 这 里 会 将 int 类 型 的 字符 字 耐量 'abc ' 截取 其 最 低 字 节 'c' 给 对 象 ch 
// 其 他 高 字 节 部 分 被 舍弃 

ch = 'abc'; 

printf("ch = %c\n", ch); // 输出 c 


























有 警告 ， 











// 这 里 不 


























使 用 方法 。 











号 8 位 整数 对 





号 8 位 整数 对 象 b 


无 符号 8 位 整数 对 象 c 
符号 8 位 整数 对 象 d 








Ar 1 




















于 付 


a' 对 它 初 始 化 














// 字符 a 立 于 对 象 S 的 最 低 字 节 位 置 ， 字 符 \0 位 于 对 象 s 的 最 高 字 节 位 置 
int s = '\QOcba' 
printf("s = %s\N", (char*)&s); // 输出 abc 










































































// 八进制 数 0969 相 当 于 十 六 进 制 数 09x30， 对 应 于 ASCII 码 的 罗马 数字 9 

ch = '\060',， 

printf("ch = %c\n", ch); // 输出 0 

// 八进制 数 0101 相 当 于 十 六 进 制 数 0x41， 对 应 于 ASCII 码 的 大 写字 母 A 

ch = '\101'，; 

printf("ch = %c\n", ch); // 输出 A 

ch = '\x42'; // 十 六 进 制 数 0x42 对 应 于 ASCII 码 中 的 大 写字 
printf("ch = %c\n", ch); // 输出 B 














// 无 效 的 转 义 符 ， 在 Clang 中 此 时 ch 的 值 为 '8， 
全 Se 制 数 中 的 每 一 位 数 都 是 在 9 到 7 的 范围 内 
C 二 1 8'，; 和 



























































// 无 效 的 转 义 符 ， 在 Clang 编 译 器 中 直接 编译 报错 
// 因为 字母 g 不 是 一 个 能 表达 十 六 进 制 数 的 有 效 字 符 
ch = '\xg0'; 




















// 输出 char 类 型 的 最 小 值 
printf("CHAR_MIN = %d\n", CHAR_MIN); 





























// 输出 char 类 型 的 最 大 值 
printf("CHAR_MAX = %d\n", CHAR_MAX); 








代码 清单 5-6 中 ， 对 于 printf ("s=%s\n"， 《char*) &s) ; 这 条 代码 
我 们 用 到 了 投射 操作 与 指针 的 概念 ， 这 些 知识 稍 后 会 做 详细 介绍 。 这 里 
仅仅 给 大 家 阐明 多 字 节 字符 字面 量 赋值 给 一 个 int 对 象 后 ， 其 在 小 端 模式 
下 存储 数据 的 方式 。 说 到 这 里 ， 聪 明 的 读者 可 能 会 有 这 么 一 个 问题 : 
为 \060' 表 示 的 是 一 个 八进制 数 ， 如 果 想 要 表达 一 个 {\0'，'4，'3'，'2'} 这 
么 一 个 多 字 节 字符 该 怎么 做 呢 ?” 因 为 \043' 本 身 是 一 个 有 效 的 八进制 转 义 
字符 ， 对 应 于 十 六 进 制 数 0x23， 在 ASCII 码 表 中 对 应 于 # 字 符 。 所 
以 \0432' 相 当 于 #2'。 此 时 ， 我 们 能 想到 的 是 ， 对 于 一 个 八进制 转 义 字 
符 ， 在 \ 后 面 最 多 只 能 跟 3 个 八进制 数 ， 所 以 我 们 索性 将 \0 写 作为 \000 即 
可 解决 这 个 问题 。 当 然 ， 我 们 也 可 以 分 别 将 后 面 的 三 个 字 
符 4、'3'、2 分 别 用 八进制 或 十 六 进 制 转 义 字符 来 代替 。 我 们 可 以 实践 




















一 下 以 下 代码 : 





#include <stdio.h> 
int main(int argc, const char * argv[]) 
// 这 里 s 的 值 相当 于 '\O#2" 


int s = '\x0\0432'，; 
printf("s = %s\n"，(char*)&s); // 输出 2# 























// 这 里 $s 的 值 相当 于 最 高 字 节 为 字符 ' N01' 

// 低 三 个 字 节 依次 为 '432， 

s = '\000432'; 

printf("s = %s\n"，(char*)&s); // 输出 234 


// 或 者 可 以 这 么 写 
S = '\0\x34\x33\x32'， 
printf("s = %s\n"，(char*)&s); // 输出 234 




















5.1.7” 宽 字符 以 及 Unicode 字 符 类 型 


从 C99 标 准 中 引入 了 wchar_t 类 型 来 表示 一 个 多 字 节 字符 。wchar_t 并 
不 是 C 语 言 的 一 个 关键 字 ， 而 是 定义 在 <stddef.h> 头 文件 中 的 一 个 宏 类 
型 。wchar t 类 型 在 不 同 环境 ， 其 长 度 也 可 能 不 一 样 ，C 语 言 标准 没有 规 
定 它 必须 占用 多 少 字 节 。 当 前 编译 器 一 般 将 wchar_t 定 义 为 4 个 字 节 的 宽 
度 ， 有 些 老 的 编译 器 可 能 为 2 个 字 节 。 宽 字符 的 字面 量 为 一 般 字符 字面 
量 前 加 大 写字 母 L 前 经， 这 里 各 位 要 注意 ， 必 须 是 大 写字 母 ， 不 能 是 小 
写 的 。 比 如 ，La'、 世 你 ' 等 都 属于 wchar t 类 型 的 宽 字 符 字 面 量 。 宽 字符 
在 C 语 言 中 的 定义 比较 模糊 ， 它 主要 根据 当前 系统 的 语言 环境 设置 ， 可 
能 是 UTF-16 编 码 、GB2312、 拉 丁 系 编码 格式 等 。 筑 字符 在 不 同 语言 环 
境 下 ， 其 相应 的 所 显示 出 来 的 字样 都 可 能 会 不 同 。 由 此 ，C 语 言 标准 组 




















织 在 C11 标 准 中 引入 了 Unicode 字 符 类 型 。 


C11 中 主要 引入 了 UTF-8 字 符 串 、UTF-16 字 符 以 及 字符 串 类 型 和 
UTF-32 字 符 及 字符 串 类 型 。 正 如 在 2.6 节 所 描述 的 ，UTF-8 编 码 的 长 度 范 
围 为 1 一 4 个 字 节 ， 所 以 在 C 语 言 中 可 以 直接 用 char 类 型 来 表示 当前 一 个 
UTF-8 编 码 字符 的 一 个 字 节 ， 它 已 经 涵盖 了 基本 的 ASCII 码 。 如 果 要 表 
示 中 文 、 日 文 等 UTF-8 字 符 的 话 ， 则 需要 使 用 字 节 数组 。C11 中 ， 引 入 
了 新 的 头 文 件 <uchar.h>， 其 中 定义 了 UTEF-16 字 符 类 型 ----<char16 ft 以 及 
UTF-32 字 符 类 型 ----char32_t。 不 过 C 语 言 标准 委员 会 做 得 非常 灵活 ， 在 
标准 中 提 到 ， 当 C 语 言 编译 妖 预 完 定 义 了 __STDC_UTF_16_ 这 个 宏 时 ， 
char16_t 才 保证 被 用 作为 UTF-16 编 码 ; 当 预 先 定 义 了 _STDC_UTEF 32 
这 个 宏 时 ，char32_t 才 保证 被 用 作为 UTF-32 编 码 ; 否则 char16_t 和 
char32_t 可 能 会 留 作 其 他 字符 编码 类 型 使 用 。 在 C11 中 ，UTF-16 的 字面 

是 在 普通 字符 字面 量 前 加 小 写字 母 n， 比 如 wa'、u' 我 等 都 是 UTF-16 字 
和 从 字面 量 ; UTF-32 的 字面 量 是 在 普通 字符 字面 量 前 加 大 写字 母 U， 比 如 
U'b'、U' 好 ' 等 都 是 UTF-32 字 符 字 面 量 。 同 样 ，C11 标 准 没有 明确 提 到 
char16_t 与 char32_t 的 宽度 ， 现 在 编译 器 一 般 将 char16_t 定 义 为 unsigned 
short 类 型 ， 占 2 个 字 节 ; 将 char32_t 定 义 为 unsigned int 类 型 ， 占 4 个 字 


二 


I 




















鉴于 现在 UTF-8 和 UTF-16 都 用 得 非常 普遍 ， 我 们 将 在 以 下 代码 例子 
中 简单 描述 一 下 宽 字 符 以 及 UTF16 字 符 和 UTF-8 字 符 串 的 使 用 如 代码 清 


单 5-7 所 示 。 而 关于 字符 串 ， 我 们 将 在 7.10 节 做 详细 摘 述 。 


代码 清单 5-7” 宽 字符 与 Unicode 字 符 介 绍 





#include <stdio.h> 
#include <uchar.h> 
#include "zenny_utftrans.h" 


int main(int argc, const char * argv[]) 
// 定义 了 一 个 长 度 为 32 个 字 节 的 char 数 组 


// 这 里 后 面 用 于 存放 UTF-8 多 字 节 字符 
char buffer[32]; 






































// 声明 了 一 个 wchar_t 类 型 的 对 象 a 
wchar_t a = 上 L' 你 '，; 








// 声明 了 一 个 UTF-16 变 量 utf16Char 
char16 utf16Char = u' 好 '， 








// 在 utf16Str 数 组 中 依次 存放 a 中 的 宽 字 符 、utf16Char 的 UTF-16 字 符 
// 以 及 u'\0' 表 示 UTF-16 字 符 串 的 终结 符 
char16 utf1i6Str[] = { a, utfi6Char, u'\0'" }; 





ZennyUTF16ToOUTF8(buffer, utf1i6Str, NULL); 





printf(u8" 字 符 串 为 : %s\n"，buffer); 


printf("wchar_t 宽 度 为 : %zu\n"，sizeof(a)); 





各 位 需要 注意 的 是 ， 头 文件 <uchar.h> 尚 未 包含 在 macOS 等 部 分 Unix 
系统 中 ， 所 以 我 们 用 unsigned short 来 代替 char16 t， 或 者 我 们 可 以 用 代 
码 清 单 5-8 的 代码 自己 建 一 个 uchar.h 头 文件 。 而 在 Windows 系 统 中 倒是 已 
经 包含 了 ， 各 位 可 以 在 VS-Clang、MinGW 等 编译 器 中 直接 使 用 。 不 过 
无 论 在 哪 种 系统 环境 下 ，GCC 和 Clang 编 译 器 对 UTF-16 以 及 UTF-32 字 符 
的 字面 量 都 已 经 文 持 。 





代码 清单 5-8 ”一 个 简单 的 uchar.h 头 文件 





#pragma once 


#define _UCHAR 
#include <stdint.h> 


#define STDC_UTF_16 
#define STDC_UTF_32 








#if I!defined( cplusplus) 
typedef uint least16 t chari16 t; 
typedef uint_ least32 t char32 t; 
#endif 





各 位 可 以 看 到 ， 我 们 在 代码 清单 5-8 中 用 的 是 uint_least16_t 类 型 来 定 
义 char16_t; 使 用 uint_least32_t 类 型 来 定义 char32_t。 这 都 是 在 C11 标 准 
中 所 采用 的 定义 方式 。 关 于 类 型 定义 的 相关 内 容 ， 各 位 可 以 详细 参考 


13.4 节 内 容 。 





如 果 当 前 系统 没有 支持 <uchar.h>， 那 么 我 们 也 就 无 法 使 用 Unicode 
库 函 数 ， 因 此 笔者 这 里 自己 实现 了 UTF-16 字 符 串 与 UTF-8 字 符 串 编 码 之 
间 相 互 转换 的 函数 库 ， 头 文件 为 "zenny_utftrans.h"， 各 位 可 在 第 20 章 中 
获得 完整 的 源 代码 。 一 般 ，C 语 言 运行 时 环境 对 宽 字 符 的 输入 /输出 做 得 
都 不 太 成 熟 ， 宽 字符 库 函 数 使 用 起 来 也 比较 麻烦 ， 所 以 通常 我 们 还 是 以 
UTF-8 字 符 串 的 形式 加 以 输出 。 最 后 ， 以 上 代码 各 位 最 好 运行 在 默认 语 
言 环 境 以 UTF-8 进 行 编码 的 系统 上 。 在 Windows 系 统 上 ， 由 于 新 建文 件 
的 编码 格式 都 是 根据 本 地 语言 环境 设置 的 ， 中 文 环境 下 默认 为 GBK 编 
码 。 所 以 ， 如 果 我 们 想 要 将 当前 源 文件 的 字符 编码 格式 转换 为 UTF-8， 
那么 可 以 通过 打开 记事 本 ， 然 后 将 当前 文件 另存 为 UTF-8 编 码 格式 ， 最 
后 再 覆盖 原 有 文件 即 可 。 不 过 ， 由 于 Windows 系 统 的 打印 函数 的 输入 字 
符 串 也 需要 与 当前 系统 支持 的 语言 环境 编码 格式 一 致 ， 所 以 如 果 要 打印 

















输出 字符 串 的 话 ， 需 要 最 终 通过 系统 API 将 UTF-8 格 式 编 码 转 换 为 当前 
系统 默认 的 编码 格式 。 我 们 看 代码 清单 5-9 的 内 容 。 


代码 清单 5-9 Windows 系 统 下 将 UTF-8 编 码 字符 串 转 为 系统 默认 编 


码 字符 串 





#include <wWindows.h> 
#include <stdio.h> 

#include <string.h> 
#include <stdlib.h> 


static void UTF8ToDefaultString(char dst[], const char *pUTF8SrcStr) 


if (dst == NULL || puTF8SrcSstr == NULL) 
return; 





// 源 UTF -8 字符 串 的 字 节 个 数 
const Size_t srcLen = strlen(pUTF8SrcStr); 
if (srcLen == 0) 

return; 


// 声明 widechars 作 为 中 间 转 换 的 宽 字 符 串 

wchar_t *wideChars = NULL 

// 获取 宽 字 符 串 的 实际 转换 长 度 ” 

const int wideStrLen = MultiByteTowideChar(CP_UTF8, ©0, pUTF8SrcSstr, 
(int)srcLen, NULL, 0); 





// 动态 分 配 wideChars 
wideChars = malloc(wideStrLen); 


// 做 UTF -8 字符 串 到 宽 字符 串 的 转换 
MultiByteTowideChar(CP_UTF8, 0, pUTF8SrcStr, (int)srcLen, 
wideChars, wideSstrLen); 


// 获取 系统 默认 编码 的 目的 多 字 节 字符 串 的 长 度 

const int dstLen = WideCharToMultiByte(CP_ACP, 0, wideChars, 

wideSstrLen, NULL, 0, NULL, NULL); 

// 将 中 间 宽 字符 串 转 换 为 系统 默认 编码 的 目的 多 字 季 字 符 囊 

WideCharToMultiByte(CP_ACP, 0, wideChars, wideSstrLen, dst, dstLen, 
NULL, NULL); 


// 在 目的 字符 串 最 后 添加 '\0' 作 为 结束 符 
dst[dstLen] = '\0'; 
































// 释放 wideChars 
free(wideChars); 


int main(void) 


// 声明 存放 系统 默认 的 多 字 节 字符 数组 
char dstcChars[32]; 
const char *utf8Str = u8" 你 好 ， 志 界 !"， 


// 将 UTF-8 编 码 格式 的 字符 串 转 换 为 系统 默认 编码 的 多 字 节 字符 串 
UTF8ToDefaultString(dstChars, utf8Str); 














// 输出 目的 字符 串 
puts(dstChars ) ; 

















getchar(); 








各 位 在 编译 运行 代码 清单 5-9 之 前 请 务必 确认 当前 的 C 源 文件 的 字符 
编码 格式 为 UTF-8， 和 否则 编译 会 不 通过 。 此 外 ， 上 述 代码 如 果 使 用 的 
Visual Studio 集 成 开发 环境 ， 那 么 只 能 使 用 MSVC， 因 为 当前 VS-Clang 
对 UTF-8 编 码 格 式 的 源 文件 支持 不 好 ， 会 引发 编译 错误 。 当 然 ， 如 果 我 
们 在 Windows 系 统 下 直接 使 用 MinGW 或 Clang 编 译 器 也 能 正常 编译 通 





另外 ， 笔 者 是 在 macOS 系 统 上 运行 的 上 述 代 码 。 在 macOS 系 统 下 ， 
默认 的 宽 字符 编码 格式 正好 为 UTF-16 编 码 ， 所 以 与 char16_t 类 型 兼容 。 
在 其 他 环境 下 就 未 必 能 正常 显示 上 述 输出 字符 串 了 ， 请 各 位 读者 注意 。 


5.1.8 ”size_t 与 ptrdiff_t 类 型 


size_t 在 之 前 的 标准 中 主要 用 于 sizeof 操 作 符 的 返回 类 型 。C11 标 准 
引入 了 _Alignof 操 作 符 之 后 ， 它 的 返回 类 型 也 是 size_t。size_t 定 义 在 
<stddef.h> 头 文件 中 。 通 常 我 们 使 用 size_t 作 为 一 个 指针 或 地 址 〉 转 换 
一 个 整数 的 方式 ， 它 一 般 是 无 符号 的 。 在 MSVC 与 MS-Clang 编 译 器 中 ， 
32 位 环境 下 被 定义 为 unsigned int，64 位 环境 下 被 定义 为 unsigned long 
long。 在 GCC 和 Clang 编 译 器 中 ， 无 论 是 32 位 还 是 64 位 环境 ，size_t 都 被 











定义 为 unsigned long， 因 为 unsigned long 在 GCC 和 Clang 中 ， 在 32 位 环境 
下 是 32 位 的 ， 在 64 位 环境 下 是 64 位 的 。 这 么 一 来 ， 无 论 是 哪个 编译 器 ， 
size_t 数 据 类 型 都 能 存放 当前 系统 环境 下 的 一 个 地 址 长 度 。 我 们 将 在 5.5 
节 详 细 讲 解 sizeof 操 作 符 ; 6.5.1 节 介绍 _Alignof 操 作 符 :第 7 章 详细 讲解 
指针 与 地 址 。 


ptrdiff t 类 型 用 于 两 个 指针 相 减 后 的 结果 类 型 ， 它 是 带 符 号 的 ， 在 
<stddef.h> 汰 文件 中 定义 。 在 通常 C 语 言 实 现 中 ， 它 的 宽度 与 size_t 相 
同 ， 仅 有 的 区 别 是 ptrdiff t 是 带 符 号 的 ， 而 size _{t 则 往往 是 无 符号 的 。 下 
面 的 例子 会 涉及 后 续 章 节 的 知识 《〈 见 代码 清单 5-10) ， 读 者 可 以 先 了 解 
一 下 ， 等 学 到 相关 知识 后 可 以 回 过 头 来 再 仔细 思 








代码 清单 5-10 size_t 与 ptrdiff_t 





#include <stdio.h> 
#include <stddef.h> 


int main(int argc, const char * argv[]) 


// 用 size_t 声 明了 对 象 a 
size t a = sizeof(a); // a 的 值 为 a 类 型 的 宽度 ( 即 占用 多 少 字 节 ) 


// 定义 了 指向 size_t 类 型 的 指针 对 象 p， 并 将 它 指向 对 象 a 的 地 址 


size t *p = &a; 









































int b = 100; 
// ey 并 将 它 指向 对 象 b 的 地 址 


int *q = &b; 


(size_t)p; 
(size_t)q; 


size t si 
size _t s2 

















// 这 里 ， 对 size_t 类 型 的 格式 符 需要 加 前 级 z 
printf("Address of a is: Ox%16zX\n", s1); 
printf("Address of b is: Ox%16zX\n", s2); 




















// 这 里 ， 对 ptrdiff_t 类 型 的 格式 符 需要 加 前 缀 t 
ptrdiff_ t diff = (ptrdiff_ t)q - (ptrdiff_t)p; 
printf("Address of a minus address of b is: %td\n", diff); 





在 代码 清单 5-10 中 ，##include<stddef.h> 可 省 ， 因 为 它 已 经 包含 在 
<stdio.h> 头 文件 中 了 。 


5.1.9 C 语 言 中 的 标准 整数 类 型 


在 前 面 所 讲述 的 整数 类 型 中 ， 我 们 已 经 提起 过 像 int、long 之 类 的 类 
型 在 不 同 的 编译 运行 环境 下 可 能 会 有 不 同 字 节 长 度 ， 尤 其 是 long 关 型 。 
为 了 能 使 代码 适应 更 广泛 的 编译 执行 环境 ， 我 们 在 编写 C 语 言 代码 时 可 
以 考虑 使 用 从 C99 标 准 就 已 经 引入 的 标准 整数 类 型 。 标 准 整 数 类 型 一 般 
被 定义 在 <stdint.h> 头 文件 中 ， 主 要 包含 以 下 几 关 。 











1) 固定 宽度 的 整数 类 型 : 当前 标准 能 够 支持 int8_t、uint8_t、 
int16_t、uint16_t、int32_t、uint32_t、int64_t、uint64_t 这 些 常 用 的 类 
型 。 使 用 这 些 类 型 之 后 ， 我 们 就 无 需 纠 结 signed char 的 字 节 宽度 、short 
的 字 节 宽度 、long 的 字 节 和 宽度 等 都 是 多 少 ， 因 为 这 些 类 型 从 字面 上 就 已 
经 表明 了 它们 分 别 占 多 少 字 节 。 比 如 int8_t 的 宽度 就 是 1 个 字 节 (8 比 
特 ) ; int32_t 则 是 4 个 字 节 “(32 比特 〉。 此 外 ， 以 int 作 为 前 缀 的 类 型 表 
示 是 带 符 号 的 类 型 ， 以 uint 为 前 级 的 类 型 表示 无 符号 类 型 。 所 以 ， 我 们 
今后 写 C 语 言 代码 时 应 当 优 先 考虑 这 些 标 准 整 数 类 型 。 除 了 这 些 常 用 的 
标准 整数 类 型 外 ，C11 标 准 还 定义 了 其 他 固定 宽度 的 标准 类 型 ， 不 过 这 














些 类 型 都 是 可 选 的 ，C 语 言 实现 没 必要 一 定 支 持 ， 比 如 : int24_t、 


uint24 t、 int40 t、uint40 _t、int48 t、uint48 t、int56_t、uint56_t。 





2) 最 小 宽度 整数 类 型 ， 这些 整数 类 型 表示 至 少 需 要 满足 所 指定 的 
比特 位 数 ， 但 允许 占用 更 多 的 比特 位 。 这 些 类 型 主要 有 : int_least8_t、 


uint_ least8 _t、int_least16 t、uint least16 t、int_ least32_t、 








uint least32 t、int least64 t、uint least64 t。 此 外 ， 还 有 可 选 的 24、 


40、48、56 比 特 宽 度 的 最 小 宽度 整数 类 型 。 





3) 最 快 最 小 宽度 的 整数 类 型 : 这些 整数 类 型 往往 用 于 快速 计算 。 
它们 与 最 小 宽度 整数 类 型 类 似 ， 至 少 需要 满足 所 指定 的 比特 位 数 。 不 过 
与 最 小 宽度 整数 类 型 不 同 的 是 ， 它 们 往往 具有 更 快速 的 计算 速度 。 比 如 
说 ， 有 些 硬件 〈 比 如 AMD 的 基于 GCN 架 构 的 GPU) 具有 24 位 整数 的 快 
速 乘 法 计算 ， 那 么 当 程 序 员 使 用 了 int_fast24_t 时 ， 则 能 暗示 编译 器 生成 
利用 这 种 快速 乘法 的 指令 。 这 些 类 型 主要 包括 : int_fast8_t、 

Uint fast8_t、int fast16 t、uint fast16 t、int fast32_t、uint_fast32_t、 
int_fast64_t、uint_fast64 t。 另 外 ， 还 有 可 选 的 24、40、48、56 比 特 宽 
度 。 











4) 能 存放 对 象 指针 的 整数 类 型 : 该 类 型 有 intptr_t 与 uintptr_t 两 个 。 
前 者 是 市 符号 的 ， 后 者 是 无 符号 的 。 这 个 类 型 用 于 将 一 个 对 象 的 地 址 或 
是 一 个 指针 对 象 的 值 用 一 个 整数 存放 起 来 。 








5) 最 大 宽度 的 整数 类 型 ， 这 种 类 型 表示 当前 C 语 言 实现 


整数 的 最 大 整数 类 型 ， 有 intmax_t 和 uintmax t 这 


述 了 以 上 这 些 标准 整数 类 型 的 使 用 。 


代码 清单 5-11 标准 整数 类 型 


文 两 个 。 代 码 清 


EE 容纳 所 有 
单 5-11 描 





#include <stdio.h> 








// 上 














#include <stdbool.h> 
#include <stdint.h> 


int 


‘ 


main(int argc, const char * argv[]) 


// 声明 一 个 标准 布尔 类 型 对 象 b 


bool b = true; 


// 声明 一 个 字符 类 型 对 象 c 
char c = 'A'，; 





// 声明 一 个 带 符号 8 位 整数 对 象 S8 
int8_t s8 = 10; 











// 声明 一 个 无 符号 16 位 整数 对 象 u16 
uint16_t U16 = 100; 








// 声明 一 个 带 符号 32 位 整数 对 象 S32 
Int32 t S32 = 1000; 


// 声明 一 个 无 符号 64 位 整数 对 象 u64 




































































于 <stdboo1.h> 与 <stdint.h> 没 有 被 包含 在 <stdio.h> 头 文件 中 ， 所 以 需 


// 这 里 的 整数 字面 量 仍然 可 以 用 ULL 作 为 后 级 ， 以 确保 精度 不 丢失 


























uint64 t U64 = 10000ULL; 


printf("b = %d, c = %c, s8 = %d, ui16 = %u, s32 = %d, u64 = %llu\n", 


b, c, s8, ui16, s32, U64); 


// 声明 了 至 少 需要 8 比特 的 整数 对 象 18 
Int_least8_t 18 = 30; 





// 声明 了 至 少 需要 16 比 特 的 快速 计算 整数 类 型 对 象 f16 


Uint_fast16 t f16 = 40; 


printf("18 + f16 = %d\n", 18 + f16); 


// 声明 了 一 个 能 存放 对 象 指针 的 无 符号 整数 类 型 


uintptr_t p = (uintptr_t)e&b; // Pp 这 晤 


// 声明 了 一 个 能 存放 对 象 指针 的 带 符号 整数 类 型 








I 对象 p 














存放 了 对 象 b 的 地 址 


I 对象 diff， 























// 并 且 用 对 象 b 的 地 址 与 对 象 c 的 地 址 的 差 对 其 
// 这 里 也 可 以 使 用 ptrdiff_t 类 型 






























































初始 





化 。 


intptr_t diff = (intptr_t)&b - (intptr_t)eéc; 


printf("p = Ox%.16zX\ndiff = %td\n", p, diff); 




















// 这 里 输出 最 大 整数 类 型 占 多 少 字 节 














要 另外 引入 


printf("intmax_t size: %zu bytes\n", sizeof(intmax_t)); 


52 证 癌 关 弄 





当前 在 C 语 言 中 有 3 种 实数 浮 点 类 型 ， 分 别 为 float、double 与 long 
double。C 语 言 标准 仅仅 规定 了 float 类 型 的 精度 是 double 类 型 精度 的 子 
集 ; double 类 型 精度 是 long double 精 度 的 子 集 。 在 一 般 C 语 言 实现 中 ， 将 
float 类 型 设 定 为 32 位 单 精度 浮 点 型 ， 并 采用 IEEE754 中 的 规格 化 浮 点 数 
表示 方法 ; 将 double 类 型 设 定 为 64 位 双 精 度 浮 点 型 ， 并 采用 IEEE754 中 
的 规格 化 浮 点 数 表示 方法 ; long double 在 x86 架 构 处 理 器 下 表示 扩展 双 
精度 浮 点 (80 位 浮 点 数 ， 一 般 占 用 16 个 字 节 ) ， 这 是 Intel 自 己 扩展 出 来 
的 浮 点 数 格 式 。 而 在 ARM 等 其 他 处 理 器 架构 下 ，long double 可 能 与 
double 类 型 一 样 ， 表 示 双 精度 浮 点 类 型 ， 但 宽度 仍然 可 能 是 16 字 节 ， 而 
不 是 8 字 市 。 在 一 些 GPU、DSP 或 租 入 式 处 理 占 中 ， 浮 点 类 型 可 能 支持 
部 分 IEEE754 标 准 ， 甚 至 使 用 其 他 表示 法 也 有 可 能 ， 所 以 各 位 使 用 时 需 
要 注意 。 但 在 大 部 分 条 面 环境 以 及 智能 设备 上 都 基本 可 以 满足 IEEE754 
标准 。 





























在 C 语 言 中 ， 浮 点 数字 面 量 的 表达 方式 非常 丰富 ， 最 基本 的 就 是 如 
0.1、-100.05 等 这 种 正常 的 十 进 制 浮 点 在 数学 上 的 表示 方法 。 在 十 进 制 
浮 点 数 后 面 添加 f 或 F 后 级 ， 表 示 该 字面 量 是 float 类 型 浮 点 数 ; 不 添加 任 
何 后 级 表示 double 类 型 浮 点 字面 量 ; 添加 ] 或 L 后 级 表示 long double 类 型 
的 浮 点 字面 量 。 男 外 ， 如 果 浮 点 数 的 小 数 部 分 为 0， 那 么 我 们 也 可 以 写 














为 : 10.、-5. 等 形式 ，10. 相 当 于 10.0。 同 样 ， 如 果 整 数 部 分 为 0， 那 么 我 
们 也 可 以 写作 为 .25、.1001 等 形式 ，.25 相 当 于 0.25。 


此 外 ，C 语 言 还 引入 了 对 浮 点 数 的 科学 计数 法 的 表示 。 比 如 ，3e5 或 
3E5 表 示 3*103;，6e-3 或 6E-3 表 示 6*103。 这 里 需要 注意 的 是 ，e 或 E 和 它 
前 后 两 个 数 之 间 都 不 能 有 空白 字符 ， 像 3 e 5 就 不 是 3*10? 的 科学 计数 法 
表示 了 。 此 外 ，e 或 E 右 边 的 数 必须 是 整数 ， 不 能 是 浮 点 数 。 


C 语 言 还 引入 了 十 六 进 制 浮 点 表示 法 ， 即 一 个 十 六 进 制 数 跟 p 或 P， 
再 跟 一 个 十 进 制 数 ， 表 示 p 或 P 之 前 的 十 六 进 制 数 乘 以 2 之 后 的 数 。 比 如 
0x3P“ 相 当 于 0x3*22; 0x3.5P-3 相 当 于 0x3.5*23。 这 里 需要 注意 的 是 ，p 
或 P 的 左边 必须 是 一 个 十 六 进 制 整数 或 浮 点 数 ，p 或 P 的 右边 必须 是 一 个 
十 进 制 整数 ， 并 且 十 六 进 制 浮 点 数 表示 中 ，p 与 指数 部 分 不 可 缺 省 。 十 
六 进 制 浮 点 数 到 十 进 制 浮 点 数 的 转换 可 以 参考 第 2 章 的 2.4 节 内 容 。 这 里 
十 六 进 制 浮 点 数 并 非 采用 IEEE754 所 描述 的 规格 化 浮 点 数 表示 法 ， 而 是 
一 般 的 二 进 制 浮 点 表示 法 ， 比 如 0x3.5p0 相 当 于 二 进 制 数 的 整数 部 分 为 
0011， 小 数 部 分 为 0101《〈 一 个 十 六 进 制 数 的 位 数 占 4 个 比特 ) 。 其 小 数 
部 分 的 计算 直接 用 2“+2“=0.3125 即 可 ， 或 者 更 简单 地 ， 直 接 用 5 除 以 16 
即 可 得 到 小 数 部 分 结果 ， 所 以 0x3.5 就 相当 于 十 进 制 浮 点 数 3.3125。 跟 十 
六 进 制 整数 计算 方式 类 似 ， 对 于 像 0x1.2345p0 这 种 十 六 进 制 浮 点 数 的 小 
数 部 分 《一般 术 语 上 又 称 为 尾数 部 分 ) 的 计算 方式 为 : 
2/16+3/16*+4/163+5/164。 





下 面 我 们 将 举 一 些 例子 给 大 家 操练 一 下 ， 见 代码 清单 5-12。 


代码 清单 5-12” 浮 点 类 型 





#include <stdio.h> 
#include <float.h> 


int main(int argc, const char * argv[]) 


{ 
// 定义 一 个 单 精 度 浮 点 数 对 象 f 
float f = -3.5E+3f; // f 的 值 为 3.5 * 1000 = -3500.0。 这 里 的 + 表示 正 号 ， 可 省 
printf("f = %f\n", f); 









































f=: 025f: // f 的 值 为 0 .25 
printf("f = %f\n", f); 


f = -Ox5p+10f; // f 的 值 为 -5 * 1024 = -5120 
printf("f = %f\n", f); 


// 定义 了 一 个 双 精 度 浮 点 对 象 d 
double d = -100.; // d 的 值 为 -100.0 
printf("d = %f\n", d); 











d = -1200e-5; // d 的 值 为 -1200 * 0.00001 = -0.012 
printf("d = %f\n", d); 


d = Qx30.8p-2; // d 的 值 为 Ox30.8 * 0.25 = 48.5 * 0.25 = 12.125 
printf("d = %f\n", d); 





// 定义 一 个 long double 类 型 的 对 象 g 
long double g = -0x3.5POL; // 9 的 值 为 -0x3.,5 * 1 = -3.3125 
printf("g = %Lf\n", 9g); 


g = Ox18.F8P2L * 2E3L; // (24+0.96875)*4 * 2*1000 = 199750.0 
printf("g = %Lf\n", 9g); 


printf("long double size is: %zu bytes\n", sizeof(g)); 
// 以 下 都 是 用 浮 点 数 的 科学 计数 法 来 打印 出 各 种 类 型 浮 点 数 的 最 大 、 最 小 值 


printf("float min value is: %g\n", FLT_MIN); 
printf("float max Value is: %g\n", FLT_MAX); 


























I 

















printf("double min value is: %g\n", DBL_MIN); 
printf("double max value is: %g\n", DBL_MAX); 


printf("long double min value is: %Lg\n", LDBL_MIN); 
printf("long double max value is: %Lg\n", LDBL_MAX); 





5.3 ”数据 精度 与 类 型 转换 








几乎 所 有 计算 机 编程 语言 都 会 涉及 数据 精度 以 及 类 型 转换 的 问题 。 
一 般 来 说 ， 一 个 类 型 所 占用 的 字 市 个 数 越 多 即 冤 度 越 大 ) ， 其 精度 也 
束 越 高 。 在 C 语 言 中 ， 将 整数 精度 等 级 称 为 “整数 转换 等 级 ”。 





C11 标 准 提 出 以 下 约定 。 





1) 任意 两 个 不 同类 型 的 带 符号 整数 不 会 具有 相同 等 级 ， 即 使 它们 
所 表示 的 值 一 模 一 样 。 比 如 在 32 位 环境 中 ， 一 般 int 类 型 与 long 类 型 在 整 
数 数值 上 表现 是 完全 一 样 的， 都 表示 32 位 珊 符 号 整数 ， 但 long 的 等 级 仍 


然 高 于 int 的 等 级 。 








2) 更 高 精度 的 带 符 号 整数 类 型 的 转换 等 级 应 该 高 于 较 低 精度 的 带 


符号 整数 类 型 的 等 级 。 


3) 一 个 无 符号 整数 类 型 的 转换 等 级 与 其 相应 的 带 符 号 整数 类 型 的 


等 级 相同 。 比 如 ，short 类 型 的 转换 等 级 与 unsigned short 类 型 的 一 样 。 


4) 具体 的 带 符 号 整数 的 转换 等 级 如 下 从 电 到 低 ): long long 


int>long int>int>short int>signed char。 


5) char 的 等 级 应 该 与 signed char 和 unsigned char 相 同 。 


6) size_t 与 ptrdiff_t 的 等 级 不 应 该 高 于 signed long int， 除 非 C 语 言 实 
现 需 要 支持 更 大 的 对 象 。 





就 这 一 点 而 言 ，GCC 与 Clang 编 译 器 在 64 位 执行 模式 下 将 size_t 的 实 
现 定义 为 unsigned long， 这 是 合乎 标准 的 ， 而 MSVC 与 YS-Clang 却 将 
size_t 定 义 为 了 unsigned long long， 这 显然 没有 遵守 标准 的 一 般 规定 。 


7) _Bool 类 型 〈 即 布尔 类 型 ) 的 等 级 在 所 有 标准 整数 类 型 中 是 最 低 
的 。 


5.3.1 ”整数 晋升 


对 于 一 个 整数 类 型 ， 如 果 它 的 精度 等 级 在 计算 过 程 中 从 低 转 换 到 
高 ， 那 么 这 个 过 程 称 为 “整数 普 升 "， 它 是 一 个 隐 式 转换 ， 无 需 程 序 员 写 
投 冉 操 作 符 进 行 类 型 转换 。 在 C 语 言 标准 中 ， 之 所 以 称 为 整数 晋升 是 因 
为 低 转换 等 级 提升 到 高 转换 等 级 类 型 ， 在 整数 数据 上 不 会 有 任何 变化 ， 
而 仅仅 是 类 型 变 为 更 高 等 级 了 。 比 如 ， 代 码 清单 5-13 所 示 的 整数 类 型 转 
换 都 属于 整数 晋升 。 





代码 清单 5-13 ”整数 晋升 





#include <stdio.h> 


int main(int argc, const char * argv[]) 





// 声明 了 一 个 signed char 类 型 的 对 象 c 


Signed char c = -128; 


















































// 声明 了 一 个 short 类 型 对 象 S 

short s = c; // 这 里 对 象 c 做 整数 晋升 到 short 类 型 ， 并 将 值 赋 给 对 象 s 
// 声明 了 一 个 int 类 型 对 象 i 

int i = s; // 这 里 对 象 s 做 整数 晋升 到 int 类 型 ， 并 将 值 赋 给 对 象 i 

// 声明 了 一 个 对 象 1， 并 将 对 象 i 做 整数 晋升 到 long 类 型 ， 并 将 值 赋 给 1 

long 1 = 工 

// 声明 了 一 个 对 象 g9， 并 将 对 象 1 做 整数 晋升 到 long long 类 型 ， 并 将 值 赋 给 g 


























long long g = 1; 
printf("g = %lld\n", 9g); // 输出 -128 





// 声明 了 一 个 unsigned char 类 型 对 象 a 
unsigned char a = 255; 





// 声明 了 一 个 unsigned int 类 型 对 象 U 
unsigned int u = a; // 这 里 将 对 象 a 做 整数 晋升 到 unsigned int， 并 将 值 赋 给 u 


























printf("u = %u\n", u); // 输出 255 





5.3.2” 融 符号 与 无 符号 整数 之 间 的 转换 














当 一 个 带 符 号 (无 符号 ) 整数 类 型 要 转换 为 男 一 个 无 符号 ( 带 符 
写 ) 整数 类 型 时 ， 如 末 转 换 目 标 类 型 有 足够 大 的 精度 来 容纳 原始 类 型 
那么 转换 后 的 值 是 保持 不 变 的 。 





当 一 个 原始 整数 类 型 要 转换 为 无 符号 整数 类 型 时 ， 如 果 目 标 无 符号 
整数 类 型 无 法 容纳 原始 整数 ， 那 么 ， 原 始 整 数值 通过 不 断 地 加 (或 减 ) 
目标 类 型 最 大 能 表示 的 值 再 加 1， 直 到 该 值 恰好 能 落 在 目标 无 符号 整数 
可 表示 范围 内 。 比 如 ， 一 个 -129 的 short 类 型 要 转换 为 unsigned char 类 

， 那 么 将 -129 加 上 unsigned char 最 大 能 表示 的 值 255 再 加 1， 

即 -129+ 〈255+1) =127。127 正 好 在 unsigned char 所 表示 的 范围 内 ， 加 法 





停止 ，127 就 是 最 终 转 换 到 unsigned char 类 型 的 值 。 当 然 ， 这 个 是 正式 的 
数学 上 的 表达 方式 。 在 实际 应 用 中 ， 我 们 无 需 那 么 麻烦 去 计算 ， 直 接 将 
超出 目标 无 符号 类 型 的 位 全 都 舍 去 即 可 。 比 如 ，-129 的 16 位 二 进 制 数 为 
1111111101111111， 如 果 将 它 转换 为 8 位 无 符号 类 型 ， 那 么 我 们 直接 将 
高 8 位 舍 去 ， 取 其 低 8 位 作为 目标 无 符 写 8 位 整数 类 型 即 可 ， 所 以 转换 后 
的 结果 就 是 01111111， 即 0x7F， 对 应 于 十 进 制 数 127。 这 是 高 精度 原始 
整数 转 为 低 精度 无 符号 整数 的 情况 。 如 果 是 一 个 低 精 度 的 带 符号 整 型 转 
换 为 更 高 精度 的 无 符号 整数 类 型 ， 那 么 需要 先 判断 原始 低 精 度 整数 的 符 
号 位 ， 如 果 是 0《 表 示 非 负 整 数 ) ， 则 用 0 填充 到 高 精度 无 符号 整数 ， 如 
果 是 1《〈 表 示 负 整数 ) ， 那 么 用 1 填充 到 高 精度 无 符 写 整数 。 比 如 ， 带 符 
号 8 位 整数 -1 二进制 数 为 11111111) 将 它 转 为 无 符号 16 位 整数 ， 结 果 
为 1111111111111111， 即 65535。 














当 一 个 原始 类 型 要 转 为 带 符 号 整数 类 型 时 ， 如 果 目 标 带 符号 整数 类 
型 无 法 容纳 原始 整数 ， 那 么 结果 是 由 实现 定义 的 ，C 语 言 实现 也 可 选择 
发 出 异常 信号 。 而 现在 主流 C 语 言 编 译 嚣 (比如 MSVC、GCC 和 Clang) 
对 目标 类 型 为 带 符 号 整数 类 型 的 转换 与 目标 为 无 符号 整数 类 型 类 似 。 如 
果 是 高 精度 整 型 转 低 精度 带 符号 整 型 ， 那 么 直接 做 二 进 制 数 的 高 位 截断 
即 可 。 如 果 是 低 精度 的 无 符号 整 型 转 高 精度 带 符号 整 型 ， 那 么 高 位 直接 
用 0 扩充 。 比 如 ， 无 符号 8 位 整数 255 转 为 带 符 号 16 位 整数 ， 仍 然 是 255; 
无 符号 16 位 整数 1023 转 为 带 符号 8 位 整数 ， 即 0000001111111111 转 为 带 
符号 8 位 整数 ， 直 接 截 断 高 8 位 ， 保 留 低 8 位 ， 得 到 11111111， 结 采 








为 -1 


综 上 所 述 ， 对 于 当前 主流 C 语 言 编译 如 而 言 ， 整 数 类 型 转换 主要 看 
源 操 作 数 类 型 ， 如 采 源 操作 数 是 无 符号 整数 类 型 ， 那 么 做 低 精 度 到 高 精 
度 的 整数 类 型 转换 时 采用 高 位 填 0 的 方式 ， 如 果 源 操作 数 是 带 符 号 整数 
类 型 ， 那 么 做 低 精 度 到 高 精度 的 整数 类 型 转换 时 采用 的 是 高 位 填 符 号 位 
的 方式 。 而 对 于 高 精度 到 低 精 度 的 整数 转换 ， 无 论 源 操 作 数 是 融 符 号 整 
数 还 是 无 符号 整数 ， 都 是 采用 高 位 截断 的 方式 。 下 面 将 给 大 家 举 一 些 例 
子 来 更 好 地 帮助 大 家 理解 帝 符 号 与 无 符号 数 之 间 的 转换 ， 如 代码 清单 5- 
14 所 示 。 





























代码 清单 5-14 ”这 符 号 与 无 符号 数 之 间 的 类 型 转换 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


Short s = -129; 




















unsigned char uc = s; // 这 里 是 将 s + 256 = 127 赋 值 给 uc 





printf("uc = %u\n", uc); // 输出 : uc = 127 
unsigned short us = 1023 


uc = Us; // 直接 截取 us 高 8 位 赋值 给 uc 


























































































































printf("uc = %u\n", uc); // 输出 : uc = 0 

uc = 128; 

s = Uc; // uc 为 无 符号 整数 ， 直 接 扩充 0 到 short 宽 度 

printf("s = %d\n", s); // 输出 : s = 128 

Signed char sc = -1; 

s= sc;// sc 是 带 符 写 整数 ， 将 符号 位 (这 里 是 1) or 
printf("s = %d\n", s); // 输出 : s 

SC = // 直接 截断 us 高 8 位 ， 取 其 低 8 位 给 sc 
printf( se = %d\n", sc); // 输出 : sc = -1 














us = uc; // uc 是 无 符号 整数 ， 0 le Short 类 型 的 宽度 
printf("us = %u\n", us); / 输出 : us = 128 


























Ar _D 


// SC 是 带 符号 整数 ， 将 符号 位 (这 里 是 1) 扩展 到 unsigned short 类 型 宽度 






































US = sc; 

printf("us = Ox%.4X\n", us); // 输出 : us = Qxffff 

s = 257; 

uc = s; // rg tle 取 其 低 8 位 
printf("d = %d\n", uc); // 输出 : d 





在 有 些 较 老 版 本 的 编译 器 或 者 把 编译 占 警 告 等 级 调 得 较 电 的 情况 
下 ， 高 转换 等 级 的 整数 类 型 转换 为 低 转换 等 级 的 整数 可 能 会 出 现 警 告 ， 
此 时 我 们 可 以 用 投射 操作 符 (cast operator) 做 显 式 的 类 型 转换 来 规避 这 
些 警 告 。 不 过 ，C11 标 准 提 到 的 是 ， 投 射 操作 符 主 要 用 于 涉及 指针 的 类 
型 转换 ， 对 于 基本 数据 类 型 ， 可 用 也 可 不 用 。 





投 射 操作 符 非 常 简 单 ， 就 是 用 圆 括号 将 某 个 类 型 包围 住 。 比 如 ; 
(int) 、 (ong long) 等 。 


代码 清单 5-15 描 述 了 投射 操作 符 的 使 用 方法 。 


代码 清单 5-15 ”投射 操作 符 的 使 用 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


signed char c = 100; 





// signed char 的 转换 等 级 比 jnt 要 低 ， 所 以 在 任何 情况 下 都 无 需 投 射 操作 符 
// 但 是 加 上 投射 操作 符 做 显 式 类 型 转换 也 没 问题 


int i = c; 














// snort 的 转换 等 级 比 int 低 ， ER 不 用 投射 操作 符 可 能 会 有 警告 
























































short s = (short)i; / 将 变量 i 通 过 投射 操作 符 强制 转 为 s hort 类 型 
s = (short)65536L + (short)65536LL,; 
printf("s = %d\n", s); // 输出 0 


| 


投射 操作 符 的 优先 级 仅 次 于 单 目 操 作 符 ， 比 乘法 操作 符 优先 级 遍 。 
关于 投射 操作 符 的 详细 介绍 请 见 5.6 节 内 容 。 


5.3.3” 浮 点 数 与 浮 后 数 的 转换 以 及 浮 扣 数 与 整数 之 
间 的 转换 


浮 点 数 之 间 的 转换 与 整数 之 间 的 转换 不 同 。 因 为 一 般 处 理 器 架构 采 
用 的 是 IEEE754 规 格 化 浮 点 表示 法 ， 所 以 大 多 数 十 进 制 浮 点 数 无 法 精确 
地 用 二 进 制 浮 点 数 来 表示 ， 这 是 由 于 其 尾数 部 分 实际 上 都 是 通过 2 进行 
相 加 拟 合 而 成 的 。 所 以 ， 我 们 在 比较 两 个 浮 点 数 的 时 候 必须 谨慎 使 用 == 
相等 性 操作 符 。 


如 果 一 个 处 理 器 架构 支持 IEEE754 标 准 ， 那 么 单 精度 浮 点 与 双 精 度 
浮 点 的 转换 直接 可 根据 IEEE754 标 准 中 浮 点 数 的 表示 方式 进行 。 对 于 音 
精度 浮 点 数 转 双 精 度 浮 点 数 ， 双 精度 浮 点 数 的 符号 位 以 及 尾数 高 位 有 效 
数 都 不 需要 变动 ， 仅 仅 是 尾数 低位 添 0， 而 阶 码 部 分 则 是 用 原始 单 精度 
浮 点 的 指数 加 上 双 精度 浮 点 数 指定 的 中 经 指数 偏差 即 可 。 而 双 精度 转 音 
精度 则 可 能 会 产生 精度 丢失 。 











C11 标 准 提 到 ， 一 个 有 限 浮 点 型 实数 〈 即 它 不 是 一 个 非 数 NaN， 也 
不 是 一 个 无 穷 大 数 INF) 可 以 转换 为 除 布 尔 类 型 之 外 的 其 他 所 有 整数 类 


， 然 后 其 小 数 部 分 被 丢弃 ， 也 就 是 说 它 的 值 向 零 截断 。 如 果 一 个 浮 点 
数 转 为 较 低 精度 的 无 符号 整数 〈 比 如 一 个 单 精度 浮 点 数 转 为 一 个 无 符号 
8 位 整数 ) ， 那 么 该 浮 点 数 是 先 转 为 与 它 相 同 宽 度 的 带 符 号 整数 〈 先 转 
signed int) ， 然 后 再 转 为 相应 更 低 精 度 的 无 符号 整数 〈 再 转 unsigned 
char) ， 还 是 直接 转 为 与 低 精度 无 符号 整数 相同 宽度 的 带 符 号 整数 〈 先 
转 signed char) ， 人 然后 再 转 为 该 相同 精度 的 无 符号 整数 (再 转 unsigned 
char) ， 这 一 点 在 标准 中 没有 提 到 ， 也 是 由 实现 定义 的 。 同 样 ， 当 一 个 
整数 转 为 一 个 浮 点 数 时 ， 倘 若 目 标 浮 点 数 无 法 容纳 原始 整数 的 数值 范 
围 ， 那 么 结果 也 是 未 定义 的 。 








下 面 我 们 将 举 一 些 例 子 来 描述 浮 点 数 与 浮 点 数 之 间 的 转换 ， 以 及 序 
尽数 与 整数 之 间 的 相互 转换 ， 如 代码 清单 5-16 所 示 。 


代码 清单 5-16 ” 浮 点 数 与 整数 之 间 的 转换 





#include <stdio.h> 

int main(int argc, const char * argv[]) 
float f = 3.1415926f,; 
double d = ff; 


// 输出 1， 说 明 两 者 相等 
printf("d == 3.1415926f? %d\n", d == 3.1415926f); 


// 输出 0， 说 明 两 者 不 相等 。 

// 因为 3.1415926 这 个 字面 量 在 单 精度 与 双 精 度 浮 点 的 表达 上 不 具有 相同 尾数 ， 

// 由 于 双 精 度 具 有 更 高 精度 ， 所 以 其 尾 交 部 分 个 是 简单 地 通过 在 单 本 度 汉 点 的 基 而 上 添加 夫 所 得 ， 
// 而 是 继续 对 该 小 数 做 进一步 拟 合 ， 使 得 双 精 度 浮 点 数 与 所 表 达 的 字面 量 的 值 更 接近 

// 所 以 ， 这 里 同样 都 是 3.1415926， 晶 多 个 f 和 少 > 个 下 就 有 千差万别 了 
printf("d == 3.1415926? %d\n", d == 3.1415926); 


























































































































































































































d = 3.1415926; 

f =d; 

// 输出 1， 说 明 两 者 相等 。 

// 于 3， 1415926 在 单 青 度 浮 点 数 的 精度 范围 内 ， 所 以 精度 在 转换 过 程 中 没有 损失 
printf("f = 3.1415926f? %d\n", f == 3.1415926f); 






























































int i = 了 

printf("i = %d\n"， 评 );// 输出 3， 说 明 仅 保留 浮 点 数 的 整数 部 分 ， 而 把 小 数 部 分 全 都 截断 
i = 100.5 + 200.5; 

// 输出 301， 说 明 这 里 两 个 浮 点 数 相 加 ， 是 将 结果 先 以 双 精 度 浮 点 的 形式 保存 ， 


// 最 后 再 转换 为 nt 类 型 
printf("i = %d\n", i); 












































i = (int)100.5 + (int)200.5; 


// 输出 309， 由 于 这 里 是 先 分 别 将 100.5 和 200 .5 转 为 nt 类 型 整数 。 
// 所 以 ， 在 它们 相 加 之 前 ， 小 数 部 分 已 经 都 被 截断 ， 使 得 结果 为 100 + 200 
printf("i = %d\n", i); 









































d = -100000000000 ,99999999999 ; 
unsigned char uc = d; 
printf("uc = %u\n", uc); // 输出 0 


uc = (long long)d; 
printf("uc = %u\n", uc); // 输出 255 


uc = (int)d; 
printf("uc = %u\n", uc); // 输出 9 








代码 清单 5-16 的 示例 是 采用 Apple LLVM 8.0 编 译 器 ， 基 于 Intel 
Haswell 架 构 处 理 器 ， 在 macOS 10.12.3 系 统 上 运行 后 得 出 的 。 


5.4  C 语 言 基本 运算 操作 人 符 


对 于 我 们 上 面 提 到 的 整数 类 型 对 象 ， 可 以 使 用 加 减 乘 除 、 求 模 等 算 
术 运 算 操作 符 ， 还 有 正 负 号 单 目 操作 符 ， 自 增 、 自 减 操作 符 ， 按 位 与 、 
按 位 或 、 按 位 异 或 、 按 位 取 反 这 四 种 按 位 逻辑 运算 操作 符 ， 以 及 移 位 操 
作 符 。 对 于 浮 点 类 型 对 象 ， 可 以 使 用 加 减 乘除 算术 运算 操作 符 ， 还 有 正 
负 号 单 目 操作 符 ， 自 增 、 自 减 操 作 符 。 这 些 操作 符 的 计算 优先 级 可 参考 
4.2.4 节 中 的 内 容 。 











5.4.1 加 、 减 、 乘 、 除 与 求 醒 运算 操作 符 


计算 两 个 整数 和 浮 点 数 的 和 、 差 、 积 、 商 、 余 数 〈 仅 整数 可 用 ) 可 
以 分 别 通 过 加 、 减 、 乘 、 除 、 求 模 这 些 操作 来 实现 。 这 些 操作 对 应 的 操 
作 符 在 C 语 言 中 分 别 记 为 : +、-、*、/、%。 这 些 都 属于 双 目 操作 符 ， 即 
每 种 操作 都 需要 两 个 操作 数 (operand) 。 在 C 语 言 中 还 有 对 左边 操作 数 
与 右边 操作 数 进行 计算 ， 然 后 直接 把 计算 结果 赋 给 左 操 作 数 的 简易 操作 
符 ， 与 上 述 操作 符 分 别 对 应 为 : +=、-=、*=、/=、%=。 在 C 语 言 标 准 中 
称 之 为 复合 赋值 操作 符 (compound assignment operator) 。 这 里 各 位 要 
注意 的 是 ， 在 做 除法 和 求 模 计算 的 时 候 ， 除 数 〈 即 右 操作 数 ) 不 能 大 
零 ， 奋 则 整个 应 用 可 能 会 导致 异常。 下 面 我 们 举 一 些 简单 的 例子 来 看 看 





这 些 操作 符 的 使 用 ， 如 代码 清单 5-17 所 示 。 





代码 清单 5-17 基本 算术 运算 操作 符 





#include <stdio.h> 


int main(int argc, const char * argv[]) 


















































int a = +100; // 这 里 的 + 可 省 

int b = -a; // b = -100 

int c =a+b; // a + b 的 值 为 9， 所 以 c 的 值 为 9 

a x*= b // 相当 于 a = a * b，a 的 值 为 -10000 

c /= a; // 相当 于 c = c / a，c 的 值 为 9 

b %= 3; // 相当 于 b = b % 3，-100 除 以 3 的 余数 为 -1 
printf("a + Cc = %d\n", a+b+c); // 输出 -10001 

b+=1+2+ 3; // 这 里 相当 于 : b = b + (1 + 2 + 3) 








float x = 10.25f; 
float y = -0.25f; 


X += y; // 相当 于 x = x + y，x 的 值 为 10. of 
y // 相当 于 y = y - x，y 的 值 为 -9.25f - 10.0f = -10.25f 
pn iy / x= %f\n", y / x); // 输出 -1.025000 











5.4.2” 按 位 逻辑 操作 符 


按 位 逻辑 操作 符 可 对 任何 整数 类 型 进行 操作 ， 包 括 布 尔 类 型 ， 但 不 
包括 浮 点 数 类 型 。 按 位 与 、 按 位 或 、 按 位 异 或 以 及 按 位 取 反 ， 在 C 语 言 
中 的 操作 符 分 别 对 应 为 : &、|、^、~。 同 样 ， 按 位 与 、 按 位 或 和 按 位 异 
或 ， 都 有 直接 赋值 的 操作 表达 方式 ， 分 别 为 : &=、F=、^=。 











下 面 举 几 个 例子 来 介绍 按 位 逻辑 操作 符 的 基本 用 法 ， 并 且 给 出 一 些 
需要 注意 的 细节 ， 如 代码 清单 5-18 所 示 。 


代码 清单 5-18 ”基本 按 位 逻辑 操作 符 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


Ee b = false; 
b |= true; // 相当 于 b = b | 1 
printf("b = %d\n", b); // 输出 1 


// 各 位 注意 ，~b 的 结果 仍然 是 11 
// Ll 在 C 语 言 中 任何 具有 返回 类 型 的 表达 式 都 可 充当 一 个 布尔 表达 式 ， 
// 然后 对 于 上 的 布尔 变量 b， 其 内 部 二 进 制 表示 是 00000001 (在 Clang 中 它 占 用 1 个 字 节 ) 。 
// 所 以 ， 这 里 对 b 采 用 按 位 取 反 操作 后 ， 内 部 结果 应 该 变 为 11111110， 十 六 进 制 数 为 Ooxfe。 
// es 9xfe 与 6 比较 ， A 7 
b = 于 按 位 取 反 只 需要 一 个 操作 数 ， 所 以 它 没有 ~= 这 种 形式 
i = %d\n", b); 0 输出 1 





三 















































演 嚣 

















































































































unsigned long long x = OxffffffffffffffffULL; 


// 0 原本 是 int 类 型 ， 但 &= 的 左 操作 数 是 一 个 unsigned long long 类 型 ， 

// 转换 等 级 比 ijnt 要 高 ， 所 以 这 里 的 9 会 先 被 隐 式 地 做 整数 晋升 ， 

// 把 它 提 升 到 unsigned long long 的 宽度 ， 然 后 再 对 它 做 按 位 取 反 操作 

x &= ~0; // 这 里 相当 于 x = x & ~0。 操 作 后 ，x 的 值 仍然 为 OxXffffffffffffffff 

















int a = 0; 
x &= ~a; // 这 里 与 上 述 情况 一 样 
printf("x = Ox%.1611X\n"，x); // 输出 Oxffffffffffffffff 


























5.4.3” 自 增 、 自 减 操 作 符 








自 增 、 自 减 操作 符 可 用 于 整数 类 型 与 浮 点 数 类 型 的 变量 ， 也 能 用 于 
旨 针 变量 。 不 过 它们 只 能 作用 于 可 被 修改 的 左 值 (关于 左 值 的 概念 请 参 
考 14.4 节 ) 。 目 增 、 目 减 操 作 符 有 两 种 形式 ， 一 种 是 作为 前 组 操作 符 ， 
另 一 种 是 作为 后 缀 操作 符 。 作 为 前 缀 操作 符 时 ， 其 计算 优先 级 作为 单 目 
操作 符 的 优先 级 ， 所 以 其 作为 后 级 操作 符 的 计算 优先 级 比 作 为 前 级 操作 
符 的 优先 级 要 高 一 级 。 当 目 增 作为 前 绥 操 作 符 使 用 时 ， 它 的 计算 过 程 束 
相当 于 《操作 数 +=1) 。 前 级 ++ 操 作 符 的 结果 就 是 操作 数 执行 递增 之 后 


的 值 。 比 如 : int b=++a; 就 好 比 int b; a+=1; b=a; ， 或 int b=a+1; 
a+=1; 前 级 自 减 操 作 符 也 同样 如 此 。 当 自 增 作为 后 级 操作 符 使 用 时 ， 后 
级 ++ 操 作 符 的 结果 是 操作 数 执 行 ++ 之 前 的 值 。 然 后 ， 操 作 数 对 象 的 值 
将 作为 副作用 在 原 有 基础 上 递增 。 对 后 级 ++ 操 作 结果 的 值 计算 ， 其 顺序 
将 在 更 新 操作 数 本 身 值 的 副作用 之 前 。 比 如 : intb=a++; 就 好 比 int 
b=a; a+=1; 后 级 -- 操 作 符 也 同样 如 此 。 


下 面 举 一 些 简单 易 异 的 例子 ， 如 代码 清 蛙 5-19 所 示 。 


代码 清单 5-19” 自 增 自 减 操 作 符 





#include <stdio.h> 
int main(int argc, const char * argv[]) 
int a = 1; 


int b = ++a; // 相当 于 int b = a += b 的 值 为 原来 a 的 值 加 1 的 结果 
int c = a++ + ++b; // c 的 值 为 a + (b + 1)， 多 局 a Sb 名 省 递增 














// 输出 : a = b = 5 
printf("a = a b = a c= %d\n", a, b, c); 


float f = 10.5f; 
float g = f++; // g 的 值 为 原来 f 的 值 ， 然 后 和 递增 


// 输出 : f = 11.500000，g = 10.500000 
printf("f = %f, g = %f\n", f, 9g); 











在 使 用 递增 、 递 减 的 时 候 往 往 会 牵涉 程序 执行 顺序 问题 ， 关 于 此 问 
题 读 者 可 参考 14.5 节 。 


5.4.4 关系 操作 符 、 相 等 性 操作 符 与 逻辑 操作 符 


在 C 语 言 中 ， 关 系 操作 符 (relational operators) 的 表示 基本 与 数学 
上 的 表示 一 致 一 一 用 > 表示 大 于 关系 ， 用 < 表示 小 于 关系 ， 用 >= 表 示 大 
于 等 于 关系 ， 用 <= 表 示 小 于 等 于 关系 。 相 等 性 操作 符 (equality 
operators) 束 两 个 :一 个 是 == 表 示 相 等 ， 男 一 个 是 ! = 表示 不 等 。 用 这 
些 操作 符 计 算得 到 的 结果 是 一 个 int 类 型 。 如 果 这 些 操作 符 的 左 操作 数 满 
足 右 操 作 数 的 指定 关系 ， 那 么 返回 1， 人 否则 返回 0。 在 5.1.5 节 中 已 经 提 到 
了 ， 由 于 C 语 言 一 开始 并 没有 引入 “布尔 类 型 > 这 个 概念 ， 而 仅仅 是 通过 
与 0 比较 来 得 出 真 假 值 。 所 以 就 当前 的 C11 标 准 而 言 ， 这 些 操作 符 所 返回 
的 类 型 仍然 被 定义 为 int 类 型 ， 而 不 是 _Bool 类 型 ， 这 是 为 了 能 与 之 前 C90 
标准 的 C 代 码 进 行 兼 容 。 但 是 对 现代 化 C 语 言 编程 而 言 ， 我 们 应 该 勤 用 
布尔 类 型 ， 这 不 仅 有 助 于 对 编程 语言 相关 概念 的 理解 ， 而 且 在 代码 上 也 
更 具 可 读 性 与 逻辑 性 ! 同时 ， 当 我 们 要 转 到 Java、Swift 等 比 C 语 言 类 型 
更 强 的 编程 语言 上 时 也 能 更 顺手 些 。 所 以 ， 笔 者 这 里 强烈 推荐 各 位 将 关 
系 操作 符 以 及 相等 性 操作 符 的 结果 类 型 视 为 bool 类 型 (需要 引入 
<stdbool.h> 标 准 库 头 文件 ) ， 然 后 将 满足 指定 关系 的 值 看 作 
为 " 真 ”(true) ， 将 不 满足 关系 的 值 看 作为 “ 假 ”(false) 。 






































由 于 关系 操作 符 与 相等 性 操作 符 比 较 简 单 ， 而 且 与 我 们 日 常用 的 数 
学 上 的 操作 很 接近 ， 所 以 不 过 多 介绍 。 本 节 主 要 为 大 家 介绍 一 下 逻辑 操 
作 符 。C 语 言 中 有 3 种 逻辑 操作 符 : 逻辑 与 && 表 示 并 且 ; 风 辑 或 | 表示 或 
者 ; 逻辑 非 ! 表示 人 否 。C 语 言 标 准 规定 ， 逻 辑 操作 符 的 操作 数 都 应 该 是 
int 类 型 的 表达 式 ， 计 算 结果 也 是 int 类 型 。 但 这 里 也 推荐 各 位 将 逻辑 操作 





符 的 操作 数 以 及 计算 结果 视 为 布尔 类 型 。 下 面 我 们 分 别 介 绍 这 3 种 逻辑 


操作 符 。 


QD 逻辑 与 是 一 个 双 目 操作 符 ， 其 计算 过 程 是 先 判 定 左 操作 数 的 值 是 
人 否 为 真 ， 如 果 为 真 则 继续 判定 右 操 作 数 ， 如 果 左 右 两 个 操作 数 都 为 真 ， 
那么 计算 结果 为 真 ， 人 否则 计算 结果 为 假 。 但 如 果 左 操作 数 表达 式 的 值 为 
假 ， 那 么 直接 得 到 为 假 的 结果 ， 而 不 会 再 去 计算 右 操作 数 。 


包 逻 辑 或 也 是 一 个 双 目 操作 符 ， 其 计算 过 程 是 先 判 定 左 操作 数 的 值 
是 否 为 真 ， 如 果 为 真 则 直接 得 到 为 真 的 结果 ， 而 不 会 再 去 计算 右 操 作 
数 。 如 采 坞 操作 数 表达 陈 的 值 为 假 ， 那 么 再 去 判定 右 操 作 数 ， 如 果 右 操 
作 数 的 值 为 真 ， 那 么 结果 为 真 ， 如 朵 其 值 为 假 ， 那 么 结果 为 假 。 








逻辑 非 是 一 个 单 目 操 作 符 ， 如 果 其 操作 数 表达 式 为 真 ， 那 么 结果 
为 假 ， 舍 则 结果 为 真 。 这 个 操作 其 实 束 是 对 操作 数 取 风 辑 非 ， 也 惑 相当 
于 我 们 日 常 逻辑 中 对 某 一 陈述 的 否定 。 


下 面 我 们 看 一 下 代码 清单 5-20 所 举 的 一 些 例子 。 


代码 清单 5-20 关系 操作 符 与 逻辑 操作 符 


#include <stdio.h> 
#include <stdbool.h> 


int main(void) 
int x = 0, y = 0; 


// 这 里 由 于 x < 0 的 结果 为 假 ， 所 以 直接 得 到 b 为 假 。 
// ++y > 0 这 一 表达 式 不 会 被 计算 



































bool b = X < && ++y > 0; 
// 输出 : b = y = 
printf("b = ed y = %d\n", b, y); 


// 这 里 由 于 y == 9 的 结果 为 真 ， 所 以 直接 得 到 b 为 真 。 
< ==X > > 9 这 一 表达 式 不 会 被 计算 


| > i 
2/ 输出 p= 
Di 'b = 2 X = a b, x); 










































































// 输出 : !b = 
printf("!b = WN 1b); 


5.4.5” 移 位 操作 符 


之 前 在 2.9 节 为 大 家 介绍 了 移 位 操作 。 在 C 语 言 标准 中 将 移 位 操作 也 
称 为 “ 按 位 移 位 操作 ”， 并 且 没有 明确 指定 移 位 操作 用 的 是 算术 移 位 还 是 
逻辑 移 位 。C 语 言 中 使 用 << 操 作 符 表示 左 移 操 作 ， 使 用 >> 操 作 符 表示 右 
移 操 作 ， 它 们 都 是 双 目 操作 符 ， 并 且 其 左右 操作 数 都 必须 是 整数 类 型 。 
a<<b 表 示 对 整数 a 向 左 移 b 位 ; a>>b 表 示 对 整数 a 向 右 移 b 位 。C 语 言 标准 
中 明确 声明 了 ， 如 果 移 位 操作 的 右 操 作 数 为 负数 ， 或 者 右 操作 数 的 值 大 
于 等 于 左 操作 数值 的 位 宽 ( 即 由 多 少 个 比特 构成 ) ， 那 么 行为 是 未 定义 
的 。 比 如 ， 在 一 般 32 位 系统 环境 下 ，1<<-1、2>>32 这 些 移 位 操作 的 结 
都 是 未 定义 的 。 而 当前 主流 C 语 言 编译 器 的 移 位 行为 都 直接 与 当前 所 运 
行 的 处 理 器 的 移 位 特性 相关 。 也 就 是 说 ， 处 理 器 如 何 处 理 移 位 的 右 操作 
数 为 负数 ， 或 者 右 操作 数 的 数值 大 于 等 于 左 操作 数位 宽 的 情况 ， 那 么 计 
算 结果 就 如 此 被 处 理 执行 。 关 于 这 点 ， 各 位 可 以 回顾 一 下 2.9 节 中 的 相 
关内 容 。 当 然 ， 对 于 未 定义 行为 的 情况 我 们 还 是 需要 慎重 对 待 ， 应 当 尽 





量 避 免 移 位 的 右 操作 数 为 负数 的 情况 ， 以 及 右 操 作 数 的 数值 大 于 等 于 左 
操作 数位 宽 的 情况 。 


不 过 当前 主流 编译 堪 以 及 大 部 分 炭 入 式 系 统 相 关 的 C 语 言 编 译 右 仍 
然 区 分 了 逻辑 右 移 与 算术 右 移 。 对 于 右 移 操 作 ， 采 用 的 是 算术 右 移 还 是 
逻辑 右 移 主要 看 右 移 操作 的 左 操作 数 ， 即 移 位 操作 对 象 。 如 果 左 操作 数 
是 带 符 号 整数 类 型 ， 那 么 采用 的 是 算术 右 移 ， 如 果 是 无 符号 整数 类 型 ， 
那么 采用 的 是 逻辑 右 移 。 我 们 看 一 下 代码 清单 5-21 的 例子 。 














代码 清单 5-21 移 位 操作 





#include <stdio.h> 
int main(void) 


int a = 1; 
unsigned b = 1; 

















// 相当 于 a = a << 2， 将 带 符号 整数 对 象 a 向 左 移 2 位 ， 结 果 为 4 
a <<= 2; 
// 相当 于 b = b << 3， 将 无 符号 整数 对 象 b 向 左 移 3 位 ， 结 果 为 8 
b <<= 3; 


printf("a = %d, b = %d\n", a, b); 
Bl hi Oxfffffff6 
b= 6xfffffff6; 



















































































// 相当 于 a = a >> 30， 由 于 a 是 带 符号 整数 ， 所 以 这 里 做 的 是 算术 右 移 
a >>= 30; 
// 相当 于 b = b >> 39， 由 于 b 是 无 符号 整数 ， 所 以 这 里 做 的 是 逻辑 右 移 
b >>= 30; 





// 输出 : a = -1, b=3 
am (Ne = %d, b = %d\n", a, b); 





我 们 从 代码 清单 5-21 可 以 看 到 ， 带 符 吕 整数 a 在 做 右 移 的 时 候 ， 高 


位 填充 的 是 符号 位 ， 所 以 采用 的 是 算术 右 移 ， 结 果 为 -1。 而 无 符号 整数 
b 在 做 右 移 的 时 候 ， 蜗 位 填充 的 是 9， 所 以 采用 的 是 逻辑 右 移 ， 结 果 为 
3。 


5.4.6 圆 括号 操作 符 


同 括 写 操 作 符 主要 用 于 提升 其 操作 数 表达 式 的 计算 优先 级 ， 并 且 能 
将 其 操作 数 与 其 他 操作 符 进 行 分 隅 。 带 有 圆 括号 操作 符 的 表达 式 称 为 圆 
括号 表达 式 (Parenthesized Expression) ， 它 属于 基本 表达 式 ， 这 也 是 
计算 优先 级 最 高 的 表达 陈 。 圆 括号 操作 符 有 一 个 很 历 害 的 特性 是 ， 其 操 
作 数 表达 式 可 以 是 一 个 左 值 ， 然 后 将 得 到 的 结果 表达 式 也 作为 一 个 左 
值 ， 并 可 对 它 进行 修改 。 关 于 左 值 的 概念 可 参见 14.4 节 。 我 们 下 面 举 一 
些 简单 的 例子 ， 介 绍 一 下 圆 括 写 操作 符 〈 见 代码 清单 5-22〉。 由 于 它 使 
用 起 来 非常 自然 ， 一 般 来 说 与 我 们 在 数学 上 用 于 计算 式 中 的 效果 类 似 ， 
所 以 不 做 过 多 描述 。 











代码 清单 5-22 圆 括号 操作 符 





#include <stdio.h> 


int main(void) 











int a = 10 
// 这 里 使 用 圆 括号 操作 符 提升 a + 1 子 表达 式 的 优先 级 
a= (a+1) * 2; 












































// 这 里 对 对 象 a 使 用 圆 括号 操作 符 尽 管 没 有 实际 意义 ， 但 也 完全 合法 。 
i b= a; 





























// 这 里 输出 : a = 22，b = 22 
printf("a = %d, b = %d\n", a, b); 











int *p = (int[]) { 1, 2 }; 


// 这 里 p + 1 子 表达 式 不 是 左 值 ， 但 *(p + 1) 子 表达 式 却 是 一 个 左 值 ， 
// 然后 (* (p + 1) ) 子 表达 式 也 是 一 个 左 值 ， 所 以 可 以 对 它 做 自 增 操作 


(*(p + 1))++; 


// 输出 : p[1] 
pfintf tb [A] 


























3 
%d\n", p[1]); 





5.5 sizeof 操作 符 


sizeof 属 于 单 目 操作 符 ， 其 语法 形式 为 : 
1) sizeof 单 目 表 达 式 
2) sizeof (类 型 名 ) 


sizeof 操 作 符 返 回 其 操作 数 的 大 小 ( 即 占 用 多 少 字 节 ) ， 用 一 个 整 
数值 来 表示 ， 一 般 C 语 言 实 现 都 用 size_t 来 表示 sizeof 操 作 符 的 返回 类 
型 。 如 果 sizeof 的 操作 数 是 一 个 可 变 修改 类 型 〈 将 在 7.3 节 中 介绍 ) 的 表 

达 式 ， 那 么 该 操作 数 需 要 在 运行 时 计算 ， 否则 sizeof 仅 仅 在 编译 时 对 操 
作 数 的 类 型 进行 获取 ， 而 不 会 去 计算 操作 数 所 对 应 的 整个 表达 式 的 结 
果 。 也 就 是 说 C 语 言 实现 在 这 种 情况 下 只 需要 生成 对 应 sizeof 操 作 符 的 结 
果 相 关 代码 ， 而 无 需 生 成 作为 sizeof 操 作 数 的 表达 式 的 代码 。 











下 面 举 一 些 例子 来 帮助 各 位 理解 ， 如 代码 清单 5-23 所 示 。 


代码 清单 5-23 ”sizeof 操作 符 





#include <stdio.h> 

int main(int argc, const char * argv[]) 
int a = 10; 

这 里 假定 argc 为 1， ry 殉 


// 人 变量 argc 与 a 相 加 获得 
int array[a + argc]; 
























































// 这 里 将 会 对 array 的 大 小 在 运行 时 做 计算 


size_t size = sizeof(array); 
printf("size = %zu\n", size); // 输出 44 
size = sizeof(++a); 


printf("size = %zu, a = %d\n", size, a); // a 仍然 为 70，++a 没 有 被 执行 











double d = 10.05; 








size = sizeof d; // sizeof 操 作 符 可 以 不 加 括号 ， 但 前 提 是 操作 数 是 单 目 表达 式 
printf("sizeof d = %zu\n", size); // 输出 8 





size = sizeof d + sizeof a; 
printf("size = %zu\n", size); // 输出 12 











在 代码 清单 5-23 中 涉及 的 数组 概念 ， 我 们 将 在 第 7 章 重 点 描述 。 此 
外 ， 尽 管 C 语 言 允 许 我 们 可 以 使 用 不 带 圆 括号 的 sizeof 操 作 符 ， 但 笔者 这 
里 建议 各 位 加 上 圆 括号 ， 这 样 会 使 得 代码 更 为 直观 ， 也 不 会 受到 其 他 中 
级 表达 式 的 干扰 。 本 书后 续 章 节 中 所 涉及 的 sizeof 操 作 符 部 将 市 有 圆 括 


呈 I 


写 。 





5.6 ” 投 冉 操作 从 


投射 操作 符 《〈Cast Operator) 的 语法 很 简单 ， 就 是 在 圆 括号 中 放 上 
类 型 名 ， 用 于 修饰 一 个 表达 式 。 它 与 圆 括号 操作 符 的 区 别 在 于 ， 圆 括号 
操作 符 中 是 将 表达 式 作为 其 操作 数 ， 而 投射 操作 符 则 是 在 圆 括号 中 放 类 
型 名 。 投 射 操作 符 是 一 个 单 目 操作 符 ， 这 里 被 修饰 的 表达 式 作 为 投射 操 
作 的 操作 数 。 投 射 操作 的 实际 含义 是 : 将 一 个 表达 式 的 类 型 投射 为 该 投 
射 操作 符 所 指定 的 类 型 ， 这 个 动作 也 被 称 为 类 型 投 暑 〈Type 
Casting) 。C 语 言 标准 为 何 用 “投射 ”这 个 词 ， 而 不 是 直接 用 “ 转 
换 ”(type conversion) 呢 ? 因为 这 里 面 其 实 牵 涉 两 个 动作 : 首先 根据 当 
前 表达 式 的 内 容 找 贝 出 一 个 临时 对 象 ， 然 后 将 该 临时 对 象 做 目标 类 型 的 
转换 以 及 值 的 调整 。 因 此 整个 投 映 操 作 过 程 其 实 是 隐 式 地 创建 了 一 个 临 
时 对 象 ， 然 后 我 们 后 续 的 操作 都 是 针对 该 临时 对 象 进行 的 ， 与 原始 表达 
式 无 关 。 这 就 类 似 湖 周 围 的 树 通 过 阳光 投射 到 湖面 中 的 倒影 。 树 就 类 似 
原始 表达 式 ， 倒 影 就 好 比 临时 对 象 ， 它 们 属于 两 个 不 同 的 对 象 。 

















我 们 了 解 了 这 个 概念 之 后 就 能 对 为 何 投 映 表 达 陈 不 能 作为 左 值 〈 我 
们 将 在 14.4 贡 中 介绍 ) 做 出 合理 的 解释 了 。 一 般 C 语 言 教科 书 中 把 投射 
操作 称 为 “类 型 转换 ?是 不 严谨 的 。 我 们 可 以 先 简单 看 一 下 代码 清单 5-24 
的 例子 。 


代码 清单 5-24 投射 表达 陈 不 能 作为 雹 值 


#include <stdio.h> 


int main(int argc, const char * argv[]) 























(CShort)i)+; / 这 句 是 非法 的 ， [表达 式 不 能 做 自修 改 操作 
Short *sp = &(short)i; // 这 人 句 也 是 非 滩 的 | 对 非 左 值 不 能 取 其 地 址 
(short)i += 10 // 对 左 值 进行 投射 操作 一 般 生 是非 兴 的 


printf("*sp = %d\n" *sp); 





代码 清单 5-22 展 示 了 对 一 个 投射 表达 式 做 赋值 计算 是 非法 的 ， 取 其 
地 址 也 是 非法 的 。 而 且 C 语 言 标准 也 明确 指出 ， 一 个 投射 表达 陈 将 不 会 
产生 一 个 天 值 。 尽 管 C 语 言 标准 中 没有 指明 投射 操作 的 操作 数 是 否 可 以 
是 一 个 左 值 ， 但 在 主流 C 语 言 编 译 器 中 这 是 非法 的 。 





然而 有 趣 的 是 ， 在 Visual Studio 中 的 MSVC 编 译 器 上 ， 代 码 清单 5-22 
的 代码 能 正常 通过 编译 运行 。 因 此 ，MSVC 编 译 器 对 投射 操作 放宽 了 限 
制 ， 使 得 它 更 像 是 单纯 的 “类 型 转换 ”， 仿 佛 丢 弃 了 投射 操作 。 不 过 C 语 
言 标准 中 明确 规定 : 一 个 投射 操作 不 产生 左 值 ， 而 对 非 左 值 做 自 增 、 取 
地 址 等 操作 本 身 就 是 非法 的 ， 所 以 这 也 是 为 何 笔者 不 赞成 各 位 使 用 
Visual Studio 目 市 的 MSVC 编 译 堪 来 写 C 语 言 的 主要 原因 ， 它 对 标准 的 文 
持 不 仅 有 限 ， 而 且 还 违背 了 一 些 基 本 原则 ， 因 此 笔者 更 推荐 各 位 使 用 


VS-Clang 编 译 器 。 














最 后 ， 我 们 再 简单 讲 一 下 C11 标 准 对 投射 操作 符 的 约束 。 


1) 用 于 投射 操作 的 类 型 名 应 该 指定 一 个 标量 类 型 ， 即 非 数组 类 


型 ， 并 且 可 以 对 该 类 型 添加 _Atomic、const、volatile 等 限定 符 ; 用 于 投 
射 操作 的 类 型 名 也 可 以 指定 void 类 型 〈 详 细 请 见 7.9 节 内 容 ) 。 而 投射 操 
作 的 操作 数 应 该 具有 标量 类 型 。 





2) 涉及 指针 类 型 的 转换 ， 除 了 茶 些 允许 指针 类 型 隐 陈 转换 的 情 
况 ， 应 该 显 式 使 用 投射 操作 。 


3) 指针 类 型 不 应 该 被 转换 为 任 一 浮 点 类 型 ， 浮 点 类 型 也 不 应 该 被 
转换 为 任 一 指针 类 型 。 


比如 int* 不 能 转换 为 float 类 型 ，double 类 型 也 不 能 转换 为 double* 类 
型 。 


5.7 本章 小 结 


本 章 介 绍 了 C 语 言 中 常用 的 基本 类 型 ， 包 括 整数 类 型 、 字 符 类 型 以 
及 浮 点 数 类 型 ， 同 时 介绍 了 和 常用 的 基本 算术 逻辑 计算 、 目 增 目 减 操作 、 
按 位 操作 、 逻 辑 操作 等 。 最 后 还 讲 了 我 们 利用 的 sizeof 操 作 符 以 及 投射 


操作 符 。 





这 里 各 位 要 注意 的 是 整数 类 型 及 其 相关 表示 的 范围 是 根据 特定 处 理 
虱 以 及 特定 操作 系统 环境 来 决定 的 。 当 然 ， 本 章 中 也 列举 了 和 营 用 的 32 位 
系统 以 及 64 位 系统 中 各 种 整数 类 型 所 表示 的 数值 范围 。 其 次 ， 目 增 目 减 
操作 的 操作 顺序 需要 各 位 好 好 理解 ， 这 需要 多 实践 ， 当 然 这 里 也 不 建议 
各 位 把 目 增 目 减 操作 写 得 过 于 复杂 ， 人 否则 会 影响 代码 的 可 理解 性 。 此 
外 ， 笔 者 还 推荐 各 位 将 关系 操作 符 、 相 等 性 操作 符 以 及 逻辑 操作 符 的 结 
果 类 型 视 作 布尔 类 型 ， 这 样 能 提升 代码 的 馆 辑 性 与 可 读 性 。 最 后 ， 本 书 
也 澄清 了 类 型 投 映 的 问题 ， 它 不 单单 是 一 种 类 型 转换 ， 然 后 描述 了 投射 
过 程 概念 上 的 逻辑 。 




















第 6 革 ”用户 目 定 义 类 型 


本 章 我 们 将 介绍 C 语 言 中 的 用 户 自 定义 类 型 。 通 过 用 户 自 定义 类 
型 ， 我 们 可 以 把 一 些 数据 高 度 抽象 化 ， 从 而 能 够 把 这 些 数据 信息 组 织 成 
为 我 们 概念 上 更 易于 理解 的 模型 。 例 如 ， 我 们 可 以 定义 一 个 用 于 学 籍 管 
理 的 “学 生 信息 ?类 型 ， 或 是 定义 一 个 可 用 于 表示 交通 灯 : 红 灯 、 黄 灯 、 
绿灯 这 三 种 状态 的 数据 类 型 ， 等 等 。 本 章 还 会 介绍 C11 标 准 对 复数 
(Complex Number) 类 型 的 支持 。 














6.1 枚 举 类 型 





枚 举 (enumeration) 类 型 一 般 用 于 表示 离散 有 限 有 个 数值 的 数据 对 
象 。 比 如 刚才 提 到 的 交通 灯 的 3 种 颜色 的 灯 ， 阳 光 可 被 分 离 的 7 种 颜色 的 
光 ， 一 里 骨 子 上 的 6 种 点 的 花色 ， 等 等 。 声 明 一 个 枚 举 的 一 般 形式 如 
下 : 





enum ”标识 符 《{ 枚 举 符 列表 } 





以 上 这 种 声明 枚 举 的 形式 可 以 完整 地 称 为 枚 举 说 明 符 〈enum- 
specifier) 。 其 中 ， 枚 举 标识 符 在 C 语 言 标 准 中 又 被 称 为 枚 举 标签 
(tag) 。 枚 举 符 列 表 由 一 个 个 枚 举 符 “enumerator) 构成 ， 而 一 个 枚 举 
符 则 是 一 个 枚 举 和 常量 (enumeration constant) ， 或 带 有 一 个 常量 表达 式 


的 枚 举 常 量 。 下 面 我 们 先 举 一 些 简 单 例子 ， 请 看 代码 清单 6-1: 








代码 清单 6-1 枚 举 类 型 介绍 





// 声明 一 个 名 为 LIGHT 的 枚 举 类 型 
enum LIGHT; 








// 定义 了 一 个 名 为 TRAFFIC_LIGHT 的 枚 举 类 型 
enum TRAFFIC_LIGHT 





TRAFFIC_LIGHT_RED， // 0 
TRAFFIC_LIGHT_YELLOW, //1 


TRAFFIC_LIGHT_GREEN // 2 
// 定义 了 一 个 名 为 LIGHT 的 枚 举 类 型 
enum LIGHT 


LIGHT_RED = -2/ // -2 
LIGHT_ORANGE, // -1 


LIGHT_YELLOW = 1, //1 


LIGHT_GREEN, // 2 
LIGHT_BLUE, // 3 
LIGHT_INDIGO = LIGHT_RED + -100, // -102 
LIGHT_PURPLE // -101 











/ // 一 个 枚 举 符 列表 的 末尾 可 加 一 个 有 逗号， 这 便于 用 程序 自动 生成 C 语 言 代码 








}; 





在 代码 清单 6-1 中 ，TRAFFIC_LIGHT 和 LIGHT 都 是 枚 举 标签 ， 我 们 
一 般 就 称 为 枚 举 标识 符 或 枚 举 名 。 像 TRAFFIC_LIGHT_RED 以 及 
LIGHT_RED=-2 等 都 是 枚 举 符 。 而 像 TRAFFIC_LIGHT RED 以 及 
LIGHT_RED 等 都 属于 枚 举 冲 量 。 枚 举 符 列表 中 的 每 一 个 枚 举 冲 量 都 被 
声明 为 具有 int 类 型 的 和 常量。 如 果 枚 举 符 常量 带 有 一 个 常量 表达 式 ， 那 么 
该 表达 式 的 类 型 必须 与 int 兼 容 ， 同 时 ， 该 常量 表达 式 的 值 将 作为 该 枚 举 
常量 的 值 〈《 比 如 LIGHT_RED) 。 如 果 第 一 个 枚 举 常量 不 带 有 常量 表达 
式 ， 那 么 其 值 默认 为 0 〈 比 如 TRAFFIC_LIGHT_RED) 。 对 于 之 后 的 所 
有 枚 举 常量 ， 如 果 它 没有 常量 表达 式 为 它 赋值 ， 那 么 该 枚 举 常 量 的 值 为 
它 前 一 个 枚 举 常量 的 值 加 1 (比如 LIGHT_ORANGE ) 。 一 个 枚 举 中 的 枚 
举 符 也 被 称 为 该 枚 举 的 成 员 。 比 如 ，TRAFFIC_LIGHT 枚 举 类 型 就 有 三 
个 枚 举 成 员 ， 分 别 是 TRAFFIC_LIGHT_RED、 














TRAFFIC_LIGHT YELLOW 和 TRAFFIC_LIGHT_ GREEN。 


像 代 码 清单 6-1 中 所 声明 的 “enum LIGHT; ”以 及 “enum 
TRAFFIC_LIGHTI{IRAFFIC LIGHT _RED， 
TRAFFIC_LIGHT _ YELLOW，TRAFEFIC LIGHT _ GREEN};， ”这 整 段 代 
码 就 称 为 枚 举 说 明 符 。 


每 个 枚 举 类 型 应 该 与 char、 一 个 带 符 号 整数 类 型 或 一 个 无 符号 整数 
类 型 相 兼 容 。 有 具体 对 于 枚 举 类 型 使 用 哪 种 整数 类 型 是 由 实现 定义 的 。 比 
如 ， 在 ADS1.2 开 发 环境 中 ， 枚 举 类 型 被 默认 定义 为 与 unsigned char 类 型 
兼容 ， 而 在 当前 主流 桌面 C 语 言 编译 器 中 ， 枚 举 类 型 默认 为 与 int 类 型 相 
兼容 。 注 意 ， 这 里 议 的 是 枚 举 类 型 ， 而 不 是 枚 举 音 量 的 类 型 。 








要 声明 一 个 枚 举 类 型 的 对 象 ， 需 要 关键 字 enum 加 枚 举 标识 符 一 起 
来 声明 。 代 码 清单 6-2 曾 明了 如 何 定 义 、 使 用 枚 举 对 象 : 


代码 清单 6-2 声明 及 使 用 枚 举 对 象 





#include <stdio.h> 
#include <stdint.h> 
// 定义 了 一 个 名 为 TRAFFIC_LIGHT 的 枚 举 类 型 
enum TRAFFIC_LIGHT 








TRAFFIC_LIGHT_RED, // 0 
TRAFFIC_LIGHT_YELLOW, //1 
TRAFFIC_LIGHT_GREEN // 2 





} g_traffic; // 定义 了 一 个 全 局 的 enum TRAFFIC_LIGHT 变 量 g_traffic 
// 定义 了 一 个 名 为 LIGHT 的 枚 举 类 型 
static enum LIGHT 












































{ 
LIGHT_RED = -2， CA 
LIGHT_ORANGE, // -1 
LIGHT_YELLOW = 1, //1 
LIGHT_GREEN, // 2 
LIGHT_BLUE, // 3 
LIGHT_INDIGO = LIGHT_RED + -100, // -102 
LIGHT_PURPLE // -101 
// 定义 了 一 个 静态 的 enum LIGHT 变 量 s_light 
// 并 用 LIGHT_BLUE 枚 举 常量 对 其 初始 化 

} s_light = LIGHT_BLUE; 

// 匿名 枚 举 








enum 


DICE_ONE = 1, 

DICE_TWO， 

DICE_THREE， 

DICE_FOUR, 

DICE_FIVE, 

DICE_SIX 

// 定义 了 一 个 匿名 枚 举 类 型 ， 并 用 它 定义 了 一 个 全 局 变量 g_dice 
} g_dice = DICE_ TwoO; 


















































int main(int argc, const char * argv[]) 
































// 定义 了 enum TRAFFIC_LIGHT 的 变量 traffic， 这 里 的 enum 不 能 省 ， 
// 并 对 它 用 TRAFFIC_LIGHT_YELLOW 枚 举 常 量 对 其 初始 化 

enum TRAFFIC_LIGHT traffic = TRAFFIC_LIGHT_YELLOW， 
g_traffic = TRAFFIC_LIGHT_GREEN ， 

printf("traffic = %d，g _ traffic = %d\n", traffic, g_traffic); 




















































































































// 人 行 算术 运算 ， 尽 管 并 不 推荐 这 么 做 
g_dice += 

// 一 个 枚 流 最 能 赋值 给 一 个 整数 变量 

int32 t a = g_dice; 

// 一 个 整数 变量 也 能 赋值 给 一 个 枚 举 变 量 ， 尽 管 并 不 推荐 这 么 做 。 



























































Ds 


| 开 








// 此 时 1ight 变 量 不 是 任 一 其 有 效 的 枚 举 常量 

enum LIGHT light = a; 

printf("light is: %d\n", light); 

a += DICE_ONE; 

printf("Is a == DICE_FIVE? %d\n", a == DICE_FIVE); 
printf("light = %d\n", s_light + LIGHT_PURPLE); 

// 在 函数 内 定义 一 个 枚 举 类 型 

enum SOME_ENUM 





























SOME_ENUM1, 

SOME_ENUM2, 

SOME_ENUM3 
}se = SOME_ENUM1， 
// 将 (se + 2) 的 结 寺 条 类 型 显 式 转换 为 enum SOME_ENUM 类 型 
enum SOME_ENUM se2 = (enum SOME_ENUM)(Se + 2); 
printf("se2 = %d\n", se2); 














结构 体 基 型 


0.2 
C 语 言 中 的 结构 体 〈structure) 是 对 一 组 数据 元 素 的 有 序 组 织 。 通 过 


对 现实 世界 建立 概念 模 
、 浮 





结构 体 ， 我 们 可 以 建立 丰富 多 彩 的 数据 结构 

型 。 在 结构 体 中 我 们 可 以 存放 任意 类 型 的 数据 元 素 ， 包 括 整 数 类 型 
点 类 型 、 枚 举 类 型 ， 甚 至 仍 套 其 他 结构 体 类 型 。C 语 言 标 准 又 将 数组 和 
(aggregate) 类 型 。 要 定义 一 个 结构 体 类 型 ， 我 们 使 用 


结构 体 称 为 聚合 
关键 字 struct， 后 面 紧 跟 的 标识 符 就 作为 该 结构 体 的 类 型 名 ， 该 类 型 名 
在 C 语 言 标准 中 又 称 为 此 结构 体 的 标签 (tag) 。 结 构 体 类 型 既 可 以 定义 
在 文件 作用 域 ， 也 可 以 定义 在 函数 中 。 

6.2.1 结构 体 概述 
结构 体 类 型 的 一 般 定 义 形 式 为 


struct 标识 符 可 省 结构 体 声 明 列 表 } 


结构 体 声 明 列 表 由 各 个 声明 (包括 静态 断言 声明 〉 构成 。 裔 态 断 言 





将 在 14.3 节 中 详细 介绍 
代码 清单 6-3 展 示 了 结构 体 类 型 的 声明 以 及 定义 。 


代码 清单 6-3 ”结构 体 声 明 符 





#include <stdio.h> 

#include <stdint.h> 

// 声明 了 一 个 名 为 StructTest 的 结构 体 
Struct StructTest ， 


enum MyEnum 


MY_ENUM1, 
MY_ENUM2 
}; 


// 定义 了 一 个 名 为 MyStruct 的 结构 体 
struct MyStruct 


// 声明 了 MyStruct 的 一 个 int32_t 类 型 成 员 a 
Int32 t a; 





// 声明 了 一 个 MyStruct 的 一 个 enum MyEnum 类 型 成 员 e 
enum MyEnum e 


// 声明 了 MyStruct 的 一 个 double 类 型 成 员 d 
double d; 











// 声明 了 指向 struct StructTest 类 型 的 指针 成 员 pTest 
struct StructTest *pTest; 


// 用 一 个 静态 断言 作为 声明 ， 但 不 占用 此 结构 体 对 象 的 存储 空间 
_Static assert(MY_ENUM1 == 0， "NG"); 































































































}; 
// 定义 结构 体 StructTest 
struct StructTest 
{ 
// 声明 了 StructTest 的 一 个 ijnt16_t 类 型 成 员 s 
int16 t s,; 
// 声明 了 StructTest 的 一 个 struct MyStruct 类 型 成 员 m 
struct MyStruct m; 
// 声明 了 StructTest 中 的 一 个 匿名 结构 体 
struct { 
int32_t a, b; 
float f; 
> // 结构 体 声 明 列 表 末 尾 允 许 包 含 一 个 分 号 ， 便 于 程序 自动 生成 C 语 言 代码 
}i; // 直接 用 此 匿名 结构 体 声 明了 对 象 i 作 为 StructTest 的 成 员 
}; 





代码 清单 6-3 中 ，StructTest 以 及 MyStruct 就 是 结构 体 标签 ， 我 们 一 
般 就 称 为 结构 体 标识 符 或 结构 体 名 。 像 “struct StructTest; ”这 种 对 
StructTest 结 构 体 的 声明 以 及 后 面 对 StructTest 的 整个 定义 《从 {到 }; ) 就 


称 为 结构 体 说 明 符 。 而 像 struct MyStruct 里 人 中 的 “inta; “ 则 作为 结构 体 
中 的 声明 ， 其 中 a 就 作为 MyStruct 结 构 体 的 成 

。“ Static_assert (MY_ENUM1==0, “NG”) ; ”这 条 语句 就 是 静态 断 
对 ， 如 果 各 位 把 这 条 语句 中 的 0 改 为 1 的 话 ， 在 编译 时 就 会 报错 ， 报 错 信 
恩 为 "NG”。 


zl ” 河 


亚 


C 








在 结构 体内 除了 可 定义 基本 类 型 对 象 作为 其 成 员 之 外 ， 还 可 定义 枚 
举 、 结 构 体 等 用 户 自 定义 数据 类 型 对 象 。 比 如 ， 在 MyStruct 中 的 成 员 
e， 以 及 在 StructTest 中 的 成 员 m、i 等 。 


C 语 言 中 可 以 定义 匿名 结构 体 类 型 ， 即 结构 体 的 标识 符 可 缺 省 。 我 
们 在 代码 清单 6-1 中 最 后 几 行 能 看 到 在 MyStruct 内 定义 了 一 个 匿名 结构 体 
类 型 ， 并 用 它 声明 了 对 象 i。 匿 名 结构 体 通常 无 法 被 直接 引用 ， 所 以 我 
们 只 能 通过 直接 在 它 后 面 声明 该 类 型 的 对 象 或 指向 该 结构 体 类 型 的 指针 
进行 使 用 。 








6.2.2 ”用 结构 体 创建 对 象 并 访问 其 成 员 


上 面 我 们 讲述 了 结构 体 类 型 的 声明 和 定义 。 下 面 我 们 将 在 代码 清单 
6-4 中 描述 如 何 用 结构 体 声 明 对 象 并 对 它们 进行 初始 化 ， 以 及 如 何 访问 
结构 体 的 成 员 。 


代码 清单 6-4 


#include <stdio.h> 


// 声明 了 一 个 名 为 MyPoint 的 结构 体 


static struct MyPoint 


int main(int argc, const char * argv[]) 


{ 


float x, 
}9_point,; 



































// 在 main 函 数 中 声明 了 对 象 point， 但 没有 对 它 做 显 式 的 初始 化 
struct MyPoint point; ”// 此 时 ，point 的 x 和 y 成 员 对 象 的 值 都 是 不 确定 的 


// 访问 一 个 结构 体 对 象 中 的 某 个 成 员 使 用 “. “访问 操作 符 















































结构 体 对 象 的 声明 、 初 始 化 以 及 成 员 访问 


y， 
// 然后 立即 声明 g_point 对 象 ， 其 成 员 在 程序 加 载 完 之 后 被 初始 化 为 零 














printf("g_point.x = %f, g_point.y = %f\n", g_point.x, g_point.y); 


// 结构 体 对 象 标识 符 、， 访 问 操作 符 ， 以 及 成 员 对 象 标识 符 之 间 都 可 以 用 空白 
直 


// 我 们 更 偏向 于 直接 用 “结构 体 对 象 标识 符 ,结构 体 成 员 对 象 “ 这 种 样式 ， 中 间 都 不 包含 任何 空白 名 



































printf("point.x = %f, point.y = %f\n", point .x 


Struct MyPoint *pPoint = &point; 






































// 访问 一 个 指向 le 使 用 “->” 操 作 符 


pPoint->x = 100.0Of; 
printf("point.x = %f\n", Ce 


// | 
// 对 一 个 结构 体 对 象 显 式 初始 化 使 ) 


// 这 里 ，point2 .X 被 初始 化 为 100 .0f，point2.y 被 初始 化 为 50 .0f 


















































MyPoint 结 构 体 声明 了 point2 对 象 ， 并 对 它 显 式 初始 化 












































Struct MyPoint point2 = { 100.0f, 50.0f }; 


printf("point2.x = %f, point2.y = %f\n", point2.x, 





个 大 括号 ， 然 后 依次 指明 该 








, point . y); 
// 声明 一 个 指向 MyPoint 结 构 体 类 型 的 指针 ， 并 将 它 初始 化 为 指向 point 对 象 的 地 址 


比 时 ，point .x 的 值 也 变 为 了 100 .0f 


吉 构 体 对 应 成 员 的 值 


point2.y); 


// 结构 体 对 象 多 许 直接 用 等 号 赋值 ， 此 时 C 语 言 实现 会 直接 将 此 赋值 操作 拆 分 为 

// 依次 用 ” = 有 操作 数 的 结构 体 成 员 对 象 的 值 赋值 给 = 左 操 作 数 结构 体 成 员 对 象 的 值 ， 
// 不 过 各 个 成 员 对 象 的 赋值 执行 次 序 是 由 实现 定义 的 ， 
// 末 必 产 格 按照 成 员 对 象 在 结构 体 中 定义 的 顺序 进行 


point = point2; // 此 表达 式 相当 于 point.x = point2. 































































































printf("point.x = %f, point.y = %f\n", point.x, 


// 在 main 函 数 中 定义 名 为 MyRectang1le 的 结构 体 
Struct MyRectangle 


{ 








enum { 
COLOR_RED, 
COLOR_GREEN, 
COLOR_BLUE 








point 




































































// 作为 MyRectang1le 的 一 个 成 员 
}color; 


struct MyPoint position; 
Struct { 
float width, height; 



































x; point.y = point2.y; 
:y); 


// 这 里 定义 了 一 个 匿名 枚 举 类 型 ， 并 直接 用 它 声明 枚 举 对 象 color 


// 这 里 定义 了 一 个 匿名 结构 体 ， 并 直接 用 它 声明 结构 体 对 象 Size 
































// 作为 MyRectangle 的 一 个 成 员 
}size; 














// 这 里 直接 用 MyRectangle 结 构 体 类 型 声明 了 一 个 对 象 rect， 
匿名 结构 




















// 在 初始 化 过 程 中 依次 对 其 成 员 color、position 以 及 














对 它 直 接 做 初始 化 。 
































体 对 象 size 进 行 初始 化 





符 分 隔 。 但 习惯 上 ， 





符 


} rect = { COLOR_RED，10.0f，20.0f，90.0f，35.0f }, 


// 然后 再 直接 用 MyRectangle 结 构 体 类 型 声明 了 一 0 并 直接 对 它 进 行 初始 le 
// 这 里 在 对 jposition 以 及 size 成 员 对 象 初始 化 时 使 用 了 { }， 因 为 它们 也 是 结构 体 类 

// 从 而 可 以 对 部 分 成 员 进 行 初始 化 为 指定 的 值 。 
// 这 里 ， 仅 对 成 员 position 对 象 中 的 x 成 员 进行 初始 化 为 30 .0f; 
// 而 对 其 成 员 size 对 象 中 的 所 有 成 员 直 接 出 初始 化 为 零 

rect2 = { COLOR GREEN, { 30.0f }, { } }; 































































































printf("rect.color = %d, rect.position.x = %f, \ 
rect.position.y = %f, rect,.size.width = %f, \ 
rect.size.height = %f\n", rect.color, rect.position.x, 
rect.position.y, rect.size.width, rect.size,.height); 


printf("rect2.color = %d, rect2.position.x = %f, \ 
rect2.position.y = %f, rect2.size.width = %f, \ 
rect2.size.height = %f\n", rect2.color, rect2.position.x, 
rect2.position.y, rect2.size.width, rect2.size.height); 


// 用 MyRectangle 结 构 体 声明 了 对 象 rect3， 并 利用 指定 成 员 的 初始 化 器 对 它 进行 初始 化 。 

// 这 里 ，rect3.color 被 初始 化 为 COLOR_BLUE; rect3.position .x 初始 化 为 0 . 0f; 

// rect3.,position,y 被 初始 化 为 200 .0f; rect3.size.width 被 初始 化 为 9 . Of; 

// rect3.size.height 被 初始 化 为 50 .9f 

Struct MyRectangle rect3 = { .color 
.position.y = 200.0f, { .height 
























































= COLOR_BLUE, 

= 50.0f } }; 

printf("rect3.color = %d, rect3.position.x = %f, " 
"rect3.position.y = %f, rect3.size.width = %f, " 
"rect3,.size.height = %f\n", rect3.color, rect3.position.x, 
rect3.position.y, rect3.size.width, rect3.size.height); 








如 果 一 个 结构 体 类 型 声明 的 对 象 具 有 静态 存储 周期 (将 在 11.3 节 中 
介绍 ) 或 线程 存储 周期 (将 在 11.7 节 中 介绍 ) 一 一 比如 代码 清单 6-4 中 在 
文件 作用 域 声明 的 对 象 g_point， 那 么 该 结构 体 对 象 的 所 有 成 员 在 执行 
main 函 数 前 被 系统 默认 初始 化 为 0。 如 果 一 个 结构 体 对 象 没有 被 初始 化 
且 具 有 自动 存储 周期 〈 将 在 11.4 节 介绍 ) ， 那 么 其 成 员 对 象 的 值 是 未 定 
义 的 ， 比 如 代码 清单 6-4 中 main 函 数 里 的 第 一 行 语句 。 我 们 在 对 一 个 结 
构 体 对 象 初始 化 时 使 用 {} 作 为 其 切 始 化 颖 (initializer〉。 在 人 中 用 喜 写 
分 隔 的 表达 式 为 当前 结构 体 对 象 的 相应 成 员 的 初始 化 器 ， 可 依次 对 结构 
体 对 象 相应 的 成 员 进行 初始 化 ， 它 们 也 称 为 结构 体 对 象 的 初始 化 器 列表 
Ginitializer-list) 。 比 如 代码 清单 6-4 中 的 “struct MyPoint point2= 


{100.0f，50.0f}; ”。 其 中 ， 介 里 的 100.0f 与 50.0f 就 是 对 point2 对 象 成 员 
的 初始 化 器 ， 分 别 将 point2 对 象 的 成 员 x 与 成 员 y 初 始 化 为 100.0f 和 
50.0f， 它 们 构成 了 一 个 针对 结构 体 对 象 point2 的 初始 化 器 列表 。 而 整个 
{100.0f，50.0f} 就 是 对 结构 体 对 象 point2 的 初始 化 器 。 如 果 一 个 初始 化 中 
的 初始 化 器 少 于 当前 结构 体 成 员 的 个 数 ， 那 么 未 被 初始 化 到 的 成 员 对 象 
被 清 零 〈 也 就 是 说 ， 如 果 未 被 初始 化 到 的 成 员 是 数值 对 象 ， 那 么 被 初始 
化 为 0， 如 果 是 指针 类 型 对 象 则 被 置 为 室 ) 。 如 果 一 个 结构 体 中 还 含有 
一 个 结构 体 类 型 的 成 员 ， 那 么 对 它 初始 化 时 ， 其 初始 化 器 可 用 {} 来 分 隔 
其 他 成 员 。 比 如 上 述 代 码 中 的 rect2={200，{30.0f}， 们 }。 男 外 ， 由 于 在 
对 rect2 进 行 初始 化 的 时 候 ， 其 匿名 结构 体 类 型 的 成 员 对 象 size 没 有 任何 
初始 化 器 对 size 的 成 员 进 行 初始 化 ， 所 以 size 的 所 有 成 员 都 为 0。 

















要 访问 一 个 结构 体 对 象 的 成 员 ， 使 用 “.” 操 作 符 ， 这 在 C 语 言 标准 中 
称 为 成 员 访问 操作 符 (member-access operator) ， 它 属于 后 级 操作 符 。 
各 位 需要 注意 的 是 ， 成 员 访 问 操作 符 是 一 个 单 目 操作 符 ， 其 操作 数 是 该 
操作 符 左边 表示 结构 体 对 象 的 表达 式 ， 而 其 右边 的 结构 体 成 员 名 则 不 属 
于 操作 数 。 这 就 类 似 于 投射 操作 中 〈) 操作 符 中 的 类 型 也 不 作为 投射 操 
作 的 操作 数 一 样 ， 投 射 操作 符 的 操作 数 是 它 后 面 的 表达 式 。 比 如 代码 清 
单 6-4 中 的 “printf ("point.x=%f\n"，point.x〉; ”就 是 读 point 对 象 中 x 成 员 
的 值 。 如 果 要 访问 一 个 指向 结构 体 类 型 的 指针 对 象 ， 那 么 使 用 -> 操作 符 
(注意 ，-> 必 须 作 为 整体 ， 即 “-” 与 “>” 之 间 不 能 存在 任何 空白 符 ) 它 和 
操作 符 一 样 ， 也 属于 单 目 后 缀 操作 符 ， 我 们 将 在 7.6 节 做 详细 介绍 。 比 














如 代码 清单 6-4 中 pPoint->x=100.0f;， 就 是 将 100.0f 赋 值 给 pPoint 指 针对 象 
所 指 结构 体 对 象 〈《 即 point 对 象 ) 的 成 员 x。 我 们 将 在 第 7 章 详 细 介绍 指针 
对 象 。 此 外 ， 各 位 要 注意 的 是 ，“” 和 “- >” 访问 操作 符 只 能 访问 结构 体 中 
的 对 象 成 员 ， 而 不 能 访问 该 结构 体 中 所 定义 的 类 型 。 


最 后 ， 上 述 代码 呈现 了 如 何 使 用 指定 成 员 的 初始 化 器 (designated 
initializer) 来 对 结构 体 成 员 进 行 初始 化 。 这 个 语法 特性 从 C99 开 始 引 
入 ， 因 此 当前 MSVC、VS-Clang、GCC 和 Clang 都 能 支持 。 指 定 成 员 的 
初始 化 器 通过 “.” 操 作 符 来 指定 当前 对 哪个 结构 体 成 员 进行 初始 化 。 而 且 
一 旦 用 了 指定 成 员 的 初始 化 器 ， 对 成 员 的 初始 化 也 无 需 按照 它们 在 结构 
体 中 的 排列 次 序 进行 。 比 如 ， 我 们 可 以 用 “struct MyPoint point= 
{.y=50.0f，.x=10.0f}; ”对 point 对 象 进行 初始 化 。 其 中 ,，“.y=50.0f” 以 
及 “.x=10.0f” 均 为 指定 成 员 的 初始 化 器 。 这 样 一 来 初始 化 完 之 后 ，point.x 
就 是 10.0f，point.y 为 50.0f。 








6.2.3 ”结构 体 复合 字面 量 





从 C99 标 准 开 始 对 结构 体 还 引入 了 结构 体 复合 字面 量 (structural 
compound literal ) ， 也 称 之 为 “匿名 结构 体 对 象 ?， 可 以 对 菏 个 结构 体 对 
象 直接 用 结构 体 字 面 量 进行 赋值 。 这 样 对 于 无 法 在 初始 化 阶段 确定 值 的 
结构 体 对 象 而 言 ， 有 了 一 种 新 的 更 简便 的 赋值 方式 ， 而 无 需 通 过 一 个 临 





时 结构 体 对 象 ， 如 代码 清单 6-5 所 示 。 





代码 清单 6-5 ”结构 体 复 合 字面 量 





#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// 定义 了 一 个 结构 体 S， 并 用 此 结构 体 类 型 声明 了 一 个 变量 s 


Struct S 

















Int32 t a, b; 、 
}s; // Ss 在 这 里 尚未 初始 化 


// 在 C99 之 前 ,我们 只 能 这 么 对 s 赋 值 
s.a = 100; 
s.b = -50; 


// 或 者 是 : 
struct S tmp = { 100, -50 }; 
s = tmp; 


















































// 从 c99 标 准 开 始 ， 对 变量 s 通 过 结构 体 复合 字面 量 进行 赋值 
// 注意 ， 时 不 是 对 的 禄 站 
s= (struct S){ .a = 100, .b = -50 }; 



































二 


printf("s.a = %d, s.b = %d\n", s.a, s.b); 
// 一 个 结构 体 复合 字面 量 能 够 作为 一 个 变量 充当 左 俏 ， . 
// 从 而 可 以 对 其 内 部 变量 成 员 做 修改 操作 ， 尽 管 这 通常 来 说 没有 实践 意义 
((struct S) { 10，20 }).a += 10; 
















































































在 代码 清单 6-5 中 ，“ (struct S〉{.a=100，.b=-50}; ”就 是 一 个 结构 
体 复合 字面 量 。 其 形式 与 初始 化 非常 类 似 ， 其 实 就 是 在 初始 化 器 {} 的 左 
边 加 上 对 该 结构 体 的 投射 操作 (关于 投射 操作 符 可 详细 参考 5.3.2 节 以 及 
5.6 节 的 内 容 ) 。 我 们 看 到 ， 对 结构 体 类 型 $ 的 一 个 变量 s 进 行 赋值 时 没有 
通过 一 个 临时 变量 ， 而 直接 使 用 该 复合 字面 量 进行 赋值 。 在 代码 清单 6- 
5 的 最 后 也 可 以 看 到 ， 一 个 结构 体 复合 字面 量 可 以 充当 左 值 ， 从 而 可 直 
接 修改 其 内 部 变量 成 员 的 值 ， 这 一 点 与 其 他 一 般 的 字面 量 只 能 作为 常量 

















不 同 。 当 然 ， 对 结构 体 复合 字面 量 直 接 做 修改 操作 通常 没有 什么 实践 意 
义 ， 不 过 如 果 我 们 通过 指针 直接 指 癌 该 字面 量 的 话 ， 有 时 也 能 方便 茶 些 
操作 。 











Os 所 谓 初始 化 是 指 在 声明 了 一 个 对 象 之 后 ， 立 即 用 等 号 操 
作 符 = 对 它 做 初始 赋值 。 如 果 在 声明 时 没有 用 等 号 操作 符 对 该 对 象 进行 
操作 ， 那 么 在 此 之 后 就 不 能 再 用 初始 化 器 对 它 进 行 初始 化 了 ， 而 只 能 对 
它 做 一 般 的 赋值 处 理 。 所 以 在 上 述 代 码 中 ， 如 果 我 们 直接 用 “s= 
{.a=100，.b=-50}; ”将 会 出 现 编译 器 报错 。 





最 后 ， 关 于 匿名 结构 体 还 有 一 个 非常 有 趣 的 设 定 。 当 一 个 结构 体 中 
含有 一 个 匿名 结构 体 ， 且 没有 用 它 来 声明 一 个 成 员 对 象 时 ， 那 么 该 匿名 
结构 体 中 所 声明 的 对 象 成 员 可 直接 视 为 其 外 部 结构 体 成 员 那 样 被 直接 访 
问 。 如 代码 清单 6-6 所 示 。 








代码 清单 6-6 匿名 结构 体 的 特性 





#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// 定义 了 一 个 结构 体 S 
struct S 


{ 
// 声明 成 员 对 象 a 
Int32 _t a; 


// 定义 了 一 个 匿名 结构 体 


struct 


// 1 
int32_t b 


int32_t c 被 字 节 填充 ， 扩 展 了 4 字 节 
Fs 7 /fe 






































// 声明 成 员 对 象 d 
double d; 
}s; // 直接 用 结构 体 S 声 明 变 量 s， 且 未 对 它 初始 化 






















































































Sue 0 // 对 结构 体 变量 s 的 成 员 a 赋值 
Sub er // 对 结构 体 变量 s 的 匿名 结构 体 成 员 b 赋 值 
s.c = 2; // 对 结构 体 变量 s 的 匿名 结构 体 成 员 c 赋 值 
s.d = 10.5; // 对 结构 体 变 量 s 的 成 员 d 赋 值 
// 结构 体 S 与 以 下 结构 体 S2 的 存储 布局 完全 一 至 
struct S2 
int32_t a; 
int32_t b; 
int32_t c; // 这 里 c 被 字 节 填充 ， 扩 展 了 4 字 节 
double d; 
} 5s2; 






































// 以 下 代码 分 别 用 于 获得 结构 体 各 个 成 员 的 偏 移 位 置 

printf("offset of b1: %td\n", (ptrdiff_t)&s.b - (ptrdiff_t)&s.a); 
printf("Ooffset of c1: %td\n", (ptrdiff_t)&s.c - (ptrdiff_t)&s.a); 
printf("Ooffset of d1: %td\n", (ptrdiff_t)&s.d - (ptrdiff_t)&s.a); 


printf("Ooffset of b2: %td\n", (ptrdiff_t)&s2.b - (ptrdiff_t)&s2.a); 
printf("Ooffset of c2: %td\n", (ptrdiff_t)&s2.c - (ptrdiff_t)&s2.a); 
printf("Ooffset of d2: %td\n", (ptrdiff_t)&s2.d - (ptrdiff_t)&s2.a); 








我 们 可 以 看 到 ， 代 码 清单 6-6 中 结构 体 对 象 s 对 成 员 a、d 的 访问 与 其 
内 部 匿名 结构 体 中 的 成 员 b 和 c 的 访问 完全 相同 。 男 外 ，C 语 言 标 准 也 明 
确 指出 ， 匿 名 结构 体 的 成 员 会 被 认 作 包含 该 匿名 结构 体 的 结构 体 成 员 ， 
所 以 存储 布局 也 会 与 没有 该 匿名 结构 体 的 结构 体 一 样 。 而 对 于 上 述 代 码 
中 的 最 后 6 行 代码 ， 则 是 用 于 测试 结构 体 变 量 s 与 2 的 存储 布局 的 。 这 里 
军 涉 到 结构 体 字 市 填充 的 概念 ， 我 们 将 在 6.5 市 详细 介绍 。 此 外 ， 结 构 
体 类 型 不 能 用 作 投 射 操作 押 指 定 的 类 型 ， 即 不 能 将 一 个 对 象 类 型 强制 转 
换 为 一 个 结构 体 类 型 ， 结 构 体 对 象 不 能 直接 使 用 关系 操作 符 来 比较 大 小 
或 判定 是 否 相 等 。 























6.3 ”联合 体 关 型 





联合 体 〈union) 类 型 是 C 语 言 中 比较 特别 的 类 型 ， 在 整个 计算 机 编 
程 语言 中 ， 除 了 与 C 语 言 基 本 兼容 的 C++ 和 Objective-C 文 持 外 ， 也 就 只 
有 COBOL 文 持 这 种 类 型 了 。 联 合体 的 声明 形式 与 结构 体 类 似 ， 但 是 与 
结构 体 不 同 的 是 ， 联 合体 对 象 中 的 所 有 成 员 共 享 同 一 存储 区 域 。 联 合体 
使 用 关键 字 union 来 声明 ，union 后 面 可 跟 一 个 标识 符 作 为 该 联合 体 的 名 
字 ， 如 果 该 标识 符 缺 省 ， 那 么 称 此 联合 体 为 匿名 联合 体 。 我 们 先 通 过 代 
码 清单 6-7 来 对 比 一 下 联合 体 与 结构 体 在 存储 布局 上 的 区 别 。 




















代码 清单 6-7 联合 体 与 结构 体 存储 布 局 对 比 代 码 





#include <stdint.h> 
int main(int argc, const char * argv[]) 


struct 


}s= {0, 1,2}; 
union 
int8_t a; 
Int16 t b; 


Int32 t c; 
Ju={0}; 





代码 清单 6-7 中 ， 我 们 在 main 函 数 里 定义 了 一 个 匿名 结构 体 ， 并 用 
它 声 明了 对 象 s。 然 后 定义 了 一 个 匿名 联合 体 ， 并 用 它 声明 了 对 象 u。 对 


象 s 与 对 象 U 的 存储 布局 如 图 6-1 所 示 《〈 假 定 使 用 桌面 操作 系统 与 编译 
器 、 小 端 模式 的 处 理 器 ) : 





我 们 假设 结构 体 按照 一 般 主 流 C 语 言 编译 器 实现 方式 做 字 节 对 齐 。 
在 图 6-1 中 ， 结 构 体 对 象 s 中 的 成 员 a 是 int8_t 类 型 ， 占 用 1 个 字 市 ， 然 后 填 
充 1 个 字 节 ， 总 共 耗 费 2 个 字 布 的 存储 空间 ;成 员 b 所 以 从 侦 移 位 置 2 开 
始 ， 筷 是 int16_t 关 型 ， 占 用 2 个 字 节 ， 由 于 跟 a 共 同 构成 了 4 字 节 块 ， 且 
下 一 个 成 员 c 占 4 子 节 ， 所 以 无 需 字 市 填充 ; 成 员 c 从 偏 移 位 置 4 开始 ， 占 
用 4 字 节 空间 。 所 以 ， 对 象 s 总 共 占 用 了 8 字 节 的 存储 空间 。 




















DO 
i 
ID 
SS 


变量 u 的 存储 布局 





图 6-1 结构 体 与 联合 体 的 存储 布局 


然后 再 看 对 象 u。 联 合体 对 象 u 的 a、b、c 三 个 成 员 都 从 偏 移 位 置 0 开 
始 存放 ， 所 以 它们 完全 共享 0 号 字 节 的 存储 空间 中 的 内 容 ， 然 后 成 员 b 与 
成 员 c 共 吾 1 号 字 贡 所 存储 的 内 容 ， 而 变量 c 则 目 己 独 享 2 和 3 号 字 节 所 存 
储 的 内 容 。 所 以 联合 体 变 量 u 忌 共 只 占用 4 个 字 市 的 存储 空间 。 下 面 我 们 
通过 代码 清单 6-8 举 一 个 比较 直观 的 例子 来 验证 上 述 联 合体 变量 u 的 存储 
































布局 。 


代码 清单 6-8 联合 体 存 储 布 局 可 视 化 代码 





#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


union 


ss 了 
}uU={ .c= Ox04030201 }; 





// 输出 : a = 0x00000001，b = 0x00000201，c = 0x04030201 
printf("a = Ox%.8x, b = Ox%.8x, Cc = Ox%.8x\n", uU.a, U.b, u.c); 





代码 清单 6-8 先 对 联合 体 变 量 u 进 行 初 始 化 ， 将 它 占用 字 市 最 多 的 成 
员 c 进 行 初始 化 ， 我 们 用 比较 容易 观察 的 十 六 进 制 数 0x04030201 写 入 到 
成 员 c。 然 后 ， 我 们 观察 成 员 a、 成 员 b 和 成 员 c 的 值 。 输 出 后 我 们 发 现成 
员 a 的 值 就 是 成 员 c 的 值 的 最 低 8 位 〈 即 字 节 0) ;成 员 b 则 是 成 员 c 的 低 16 
位 《〈 即 字 节 0 和 字 节 1) 的 内 容 ; 成 员 c 则 是 初始 化 时 的 值 。 这 样 就 与 我 
们 上 面 所 描述 的 存储 布局 完全 吻合 了 。 














联合 体 在 构造 上 与 结构 体 类 似 ， 也 可 以 在 里 面 存放 其 他 类 型 的 对 象 
作为 其 成 员 ， 包 括 枚 举 、 结 构 体 以 及 联合 体 对 象 。 下 面 举 一 些 定义 联合 
体 类 型 的 例子 。 


代码 清单 6-9 ”联合 体 类 型 的 定义 





// 定义 一 个 名 为 Union1 的 联合 体 

















// 它 包含 三 个 共享 的 成 员 
union Unionl1 


int32_t a; 
int8_t b; 


int16 t s; 
}; 


// 定义 一 个 名 为 Union2 的 联合 体 


static union Union2 


// 在 Union2 中 定义 一 个 匿名 结构 体 并 直接 用 它 声明 成 员 变 量 s 
struct { 

Int32 t a; 

int32_t b; 


















































}s; 


// 声明 成 员 变 量 f， 并 与 共享 同一 联合 体 存储 单元 
float f; 






































// 直接 | 
} un; 





Union2 声 明 一 个 静态 变量 un 











enum MyEnum 



































ENUM1, 
ENUM2 

}; 

union MyUnion 

{ 
// 用 MyEnum 枚 举 类 型 声明 对 象 e 作 为 MyUnion 联 合体 的 成 员 
enum MyEnum e; 
// 用 联合 体 Union2 声 明 对 象 u 作 为 MyUnion 联 合体 的 成 员 
union Union2 u; 
// 联合 体内 也 可 放置 静态 断言 
_Static_assert(Sizeof(un) == 8, "NG"); 

}; 


// 定义 一 个 名 为 MyStruct 的 结构 体 
struct MyStruct 


{ 
int32_t a; 



































// 用 上 面 定 义 的 Union2 声 明 u1 作 为 MyStruct 的 成 员 
union Union2 ui; 


// 定义 一 个 匿名 联合 体 ， 并 直接 用 它 声明 其 对 象 u2 作 为 MYyStruct 的 成 员 
union{ 

double d; 

float f; 
}u2; 
































double dd; 
}; 





对 联合 体 对 象 的 初始 化 也 与 结构 体 类 似 ， 从 C99 标 准 起 可 使 用 指定 


成 员 的 初始 化 器 。 不 过 对 联合 体 的 初始 化 只 能 初始 化 其 中 一 个 成 员 ， 
为 所 有 成 员 都 共 胖 同一 存储 位 置 ， 所 以 如 果 对 多 个 成 员 指定 初始 化 值 时 
编译 器 可 能 会 发 出 警告 。 代 码 清单 6-10 是 对 联合 体 对 象 初始 化 以 及 赋值 
的 例子 。 





代码 清单 6-10 ”联合 体 对 象 的 初始 化 以 及 成 员 访问 





#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// 定义 了 一 个 名 为 MyUnion 的 联合 体 
union MyUnion 
{ 

// 声明 了 成 员 a 

Int32 tt a; 


// 在 MyUnion 联 合体 内 定义 了 一 个 匿名 结构 体 
Struct { 

Int16 t b; 

int8_t c; 
}s; // 直接 用 该 结构 体 声明 对 象 s 作 为 MyUnion 的 成 员 


















































// 这 里 直接 | MU 并 直接 对 它 初始 化 
// 由 于 这 里 s.b 与 s.c 作 为 同一 结构 体 变量 s 的 成 员 ， 所 以 完全 可 行 
}un={ .Ss.b = Ox0201, .s.c = Ox03 }, 


// 这 里 ，Apple LLVM 发 出 警告 ，. s .b 的 初始 化 器 会 覆盖 它 之 前 的 .a 的 初始 化 器 
unwarning = { .a = 100, .s.b = -100 }; 


// 在 C99 标 准 之 前 ， 用 常规 方法 只 外 E 对 联合 ay 个 成 员 进 行 初始 化 
union MyUnion un2 = { 100 }; / 即 un2.a 被 初始 化 为 100 















































































































































// 这 里 用 MyUnion 声 明了 对 象 un3， 但 未 对 它 进 行 初始 化 
union MyUnion un3 






































// 这 里 (union MyUnion){ .f = 10.5f } 是 个 联合 体 的 复合 字面 1 
// 与 吉 构 体 复合 字面 量 类 似 。 联 合体 复合 字面 量 可 直接 对 一 个 联合 体 对 象 进行 赋值 
un3 = (union MyUnion){ .f = 10.5f }; 


// 我 们 对 un . s 初 始 化 之 后 观察 un .a 的 值 
// 输出 : un.a = 0x00030201 
printf("un.a Ox%.8x\n", un.a); 


// 对 un2. 和 ne s.b 的 值 
// 输出 : un2.s.b = 10 
printf("un2.s. : = i un2.s.b); 











1 













































































// 对 un3 .f 初 始 化 之 后 ， 存 放 在 此 联合 体 起 始 地 址 的 数据 为 10 .5f 的 

















// 规格 化 浮 点 数 的 二 进 制 表 _ 

// 所 以 我 们 这 里 先 将 un3， a 的 地 址 转 为 浮 点 ， 然 后 再 转 整 型 来 观察 un3 .a 的 值 
// 输出 : un3.a = 10 

printf("un3.a = %d\n", (int32 t)*(float*)&un3.a); 












































代码 清单 6-10 比 较 详 细 地 介绍 了 联合 体 对 象 初始 化 、 赋 值 以 及 联合 
体 复合 字面 量 的 各 种 情况 。 此 外 ， 这 个 代码 示例 也 进一步 给 大 家 呈现 了 
联合 体 中 所 有 成 员 共享 存储 空间 的 这 一 特性 。 由 于 联合 体 对 其 成 员 的 访 
问 形式 与 结构 体 完 全 一 样 ， 因 此 这 里 不 再 歼 述 








此 外 ， 联 合体 与 结构 体 一 样 ， 不 能 用 作 投 射 操作 符 所 指定 的 类 型 ; 
联合 体 对 象 不 能 直接 使 用 关系 操作 符 来 比较 大 小 、 判 断 是 否 相同 等 。 


6.4 位 域 


位 域 (bit-fields〉 也 是 C 语 言 比较 独特 的 语法 之 一 。 通 过 位 域 ， 我 
们 可 以 将 一 串 比 特 流 进行 结构 化 描述 ， 这 在 通信 和 领域 用 得 尤为 广泛 。 在 
C 语 言 中 ， 位 域 是 在 结构 体 或 联合 体 中 指定 位 宽 的 成 员 。 通 第 我 们 都 用 
结构 体 来 指定 位 域 ， 尽 管 联合 体 也 可 以 指定 成 员 的 位 宽 ， 但 基本 没什么 
实际 意义 ， 因 为 联合 体 的 成 员 都 共享 同一 存储 单元 。 











6.4.1 位 域 的 一 般 特 性 


如 果 结 构 体 中 的 茶 一 成 员 要 作为 位 域 ， 那 么 它 必 须 是 一 个 整数 类 型 
(包括 布尔 和 枚 举 类 型 )， 而 不 能 是 浮上 扣 或 其 他 类 型 。 指 定 该 位 域 宽度 
的 表达 式 也 应 该 是 一 个 整数 常量 表达 式 ， 且 表达 式 的 值 不 能 是 负数 。 位 
域 的 基本 表达 式 为 : 











八 


类 型 > < 标识 符 > : < 位 宽 表 达 式 >， 





这 里 < 位 宽 表 达 式 > 就 用 于 指定 此 位 域 的 宽度 《〈 即 取 值 范围 ) ， 单 位 
是 比特 。 比 如 代码 清单 6-11 所 未 。 


代码 清单 6-11 结构 体位 域 的 简单 介绍 





struct BitField 


















































int32 t a : 5; // a 由 5 个 比特 构成 ， 取 值 范围 在 [-16，15] 
uint32 t b : 6; // b 由 6 个 比特 构成 ， 取 值 范围 在 [06，63] 
int32_ t c :7; // c 由 7 个 比特 构成 ， 取 值 范 围 在 [-64，63] 


}; 





代码 清单 6-11 中 ，BitField 的 成 员 a、b 和 c 都 是 位 域 。 其 中 ，a 的 宽度 
为 5 个 比特 ， 由 于 它 是 带 符 号 整数 ， 因 此 这 5 个 比特 中 最 高 位 需要 作为 符 
号 位 ， 因 此 其 取 值 范围 在 [-2%2，24-1]。 成 员 b 的 宽度 为 6 个 比特 ， 由 于 它 
是 一 个 无 符号 整 型 ， 因 此 其 取 值 范围 在 [0，2-1]。 整 个 BitField 类 型 大 小 
为 4 个 字 节 。 由 于 a、b、c 这 3 个 成 员 的 宽度 加 起 来 为 18 个 比特 ， 少 于 32 
比特 ， 一 般 C 语 言 实 现 会 将 其 扩充 到 4 个 字 节 【正好 是 一 个 int32_t 类 型 的 


宽度 〉。 

















C 语 言 对 位 域 还 有 以 下 限制 : 





1) 不 能 对 位 域 成 员 做 取 地 址 操作 ; 


2) 位 域 成 员 不 能 作为 sizeof 的 操作 数 ; 


3) 不 能 用 对 齐 属性 来 修饰 位 域 ; 





4) 指定 位 域 位 宽 的 常量 值 不 能 超过 该 类 型 可 表示 的 范围 。 
代码 清单 6-12 展 示 了 对 位 域 的 一 些 错误 的 用 法 。 


代码 清单 6-12 ”位 域 的 一 些 错 误 用 法 





#include <stdio.h> 


#include <stdint.h> 


int main(int argc, const char * argv[]) 


















































{ 
struct BitField 
_Alignas(int32_t) int32_t a : 5; // 这 句 报错 ! _Alignas 属 性 不 能 用 于 位 域 
uint32 t b : 6; 
char c : 9; // 这 句 报错 ! 一 个 char 类 型 对 象 最 多 只 能 由 8 个 比特 构成 
}bf = { 10, 20 }; 
int32_t *p = &bf.a; // 这 人 句 报 错 ! 不 能 对 位 域 做 取 地 址 操作 
size _t size = sizeof(bf.b); // 这 人 句 报错 ! sizeof 操 作 符 不 能 用 于 位 域 
} 





上 面 讲 述 了 位 域 的 形式 以 及 约束 。 下 面 我 们 将 描述 位 域 的 二 进 制 表 
达 方 式 ， 请 见 代码 清单 6-13。 





代码 清单 6-13 ”结构 体 中 位 域 的 二 进 制 表 达 形 式 





#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 











{ 

enum MyEnum 
ENUM1， 
ENUM2， 
ENUM3 

}; 

struct MyStruct 

{ 
int32 t a : 6; // a 的 范围 为 [-32，31] 
int16 t b : 5; // b 的 范围 为 [-16，15] 
int8 tc : 8; // c 的 范围 为 [-128，127] 
char x : sizeof(enum MyEnum); // 相当 于 : char x : 4 
bool y : 1; 
enum MyEnum e : ENUM3; // 相当 于 : enum MyEnum e : 2 





}s = { 0x18，0x0a，0x77，'\0'，true，ENUM3 }; 


// s 的 二 进 制 表示 : (0) 10 1 0000 601110111 (900000) 01010 011000 
// 整理 后 得 : 0101 0000 0111 0111 0000 0010 1001 1000 
printf("The size is: %zu\n", sizeof(s)); 











// 输出 9x50770298 
printf("The content of s is: 0x%,.8XxNXn"，*(UuUint32_t* )&s) ， 





代码 清单 6-13 中 ， 我 们 在 main 函 数 里 定义 了 一 个 名 为 MyStruct 的 结 
构 体 类 型 ， 其 中 的 成 员 均 为 位 域 。 我 们 看 到 ， 位 域 成 员 的 类 型 可 以 是 各 
类 整数 类 型 、 字 符 类 型 、 布 尔 类 型 以 及 枚 举 类 型 。 而 指定 位 域 宽度 的 整 
数 常量 表达 式 可 以 是 整数 字面 量 、sizeof 操 作 符 所 得 到 的 结果 、 枚 举 值 
等 ， 它 们 必须 是 在 编译 时 能 确定 值 的 常量 














6.4.2 ”位 域 成 员 的 存放 与 布局 


代码 清单 6-13 中 ， 我 们 分 别 对 MyStruct 结 构 体 对 象 的 每 个 成 员 进 行 
初始 化 ， 得 到 s 内 部 表示 的 二 进 制 如 注释 中 所 示 。MyStruct 结 构 体 类 型 大 
小 为 4 个 字 节 ， 而 s 的 二 进 制 表 示 中 ， 用 圆 括号 括 起 来 的 二 进 制 比特 表示 
是 被 填充 的 比特 ， 其 他 比特 表示 每 个 成 员 本 身 的 值 。 其 中 ， 成 员 a 是 最 
右边 的 6 个 比特 ， 然 后 之 后 的 每 个 位 域 成 员 都 依次 从 右 向 左 排列 。 比 特 
填充 对 于 不 同 编译 器 、 不 同 执行 环境 可 能 会 不 同 。 不 过 C 语 言 标准 指明 
的 是 ， 对 于 同一 结构 体内 毗邻 两 个 位 域 成 员 ， 如 果 第 一 个 位 域 成 员 仍然 
有 足够 的 存储 空间 容纳 第 二 个 位 域 成 员 ， 那 么 第 二 个 位 域 成 员 可 以 与 前 
一 个 位 域 成 员 打 包 在 一 起 ， 一 起 构成 同一 单元 的 毗邻 比特 串 ， 这 个 可 以 
参考 代码 清单 6-13 中 的 成 员 a 与 b。 成 员 a 的 类 型 为 int32 t， 位 宽 为 6 个 比 
特 ;， 成 员 b 的 类 型 为 int16 t， 位 宽 为 5 个 比特 ， 它 与 成 员 a 正 好 可 以 组 合 
在 一 起 ， 构 成 11 个 比特 的 串 ， 存 放 在 同一 单元 。 
































如 果 构 成 一 个 单元 的 存储 空间 不 够 ， 那 么 后 一 个 位 域 是 被 放 在 下 一 
个 存储 单元 还 是 与 之 前 的 单元 迭 交 存放 ， 这 是 由 实现 自己 定义 的 。 在 一 
个 单元 内 的 位 域 分 配 次 序 〈 从 高 位 序 到 低位 序 还 是 从 低位 序 到 高 位 序 ) 
也 是 由 实现 自己 定义 的 。 此 外 ， 可 寻 址 存储 单元 如 何 做 字 节 对 齐 在 标准 
中 也 是 未 指定 的 。 在 代码 清单 6-13 中 ， 我 们 看 到 成 员 c 占 8 个 比特 ， 如 果 
将 它 与 之 前 a 和 b 构 成 的 11 比 特 串 拼接 在 一 起 ， 那 么 它 超出 了 之 前 a 和 b 所 
在 的 16 比 特 可 寻 址 存储 单元 。 因 此 ， 在 AppleLLVM 的 实现 中 ， 它 采用 
的 是 将 成 员 c 放 在 下 一 个 可 寻 址 存储 单元 内 ， 所 以 成 员 a 和 b 所 在 的 单元 
最 后 高 5 位 用 0 填充 ， 直 到 正好 满 16 比 特 。 倘 若 成 员 c 的 位 宽 为 5 个 比特 ， 
那么 成 员 c 就 能 与 a 和 b 拼 接 在 一 起 ， 存 放 在 同一 可 寻 址 存储 单元 ， 如 代 
人 码 清单 6-14 所 示 。 此 外 ， 对 于 现在 桌面 操作 系统 以 及 当前 主流 C 编 译 器 
而 言 ， 在 同一 可 寻 址 存储 单元 中 采用 从 低位 序 到 高 位 序 的 排列 方式 。 



































代码 清单 6-14 成员 c 与 成 员 a 和 b 一 起 拼接 的 结构 体 





#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 
enum MyEnum 
{ 
ENUM1， 


ENUM2 ， 
ENUM3 
; 


struct MyStruct 
{ 
































int32 ta : 6; // a 的 范围 为 [-32，31] 

int16 t b : 5; // b 的 范围 为 [-16， 15] 

int8 tc : 5; // c 的 范围 为 [-16， 15] 

char x : Sizeof(enum MyEnum ) ， // 相当 于 : char x : 4 
/ 


bool y : 1 





enum MyEnum e : ENUM3; // 相当 于 : enum MyEnum e : 2 


}s = { 0x18，0x0a，0x07，'\6'，true，ENUM3 }; 














// s 的 二 进 制 表示 : (000000000) 10 1 0110 00111 01010 011000 
1000 














// 输出 9x90563a98 
printf("The content of s is: Ox%.8x\n", *(uint32 t*)e&s); 


我 们 上 面 提 到 几 个 邻近 的 位 域 成 员 可 以 被 拼接 到 同一 个 可 寻 址 存储 
单元 ， 那 么 我 们 会 有 疑问 ， 如 何 确 定 这 一 可 寻 址 存储 单元 的 大 小 呢 ? 一 
般 C 语 言 实现 可 以 先 将 第 一 个 和 第 二 个 位 域 成 员 先 拼接 在 一 起 ， 如 果 能 
成 功 拼 接 ， 那 么 观察 它们 已 占用 的 比特 个 数 ， 向 上 取 满 足 2 的 最 小 整 
数 。 比 如 代码 清单 6-13 中 ， 成 员 a 和 先 与 成 员 b 拼 接 ， 由 于 拼接 后 ， 没 有 
超出 它们 俩 任 一 类 型 的 最 大 宽度 范围 ， 所 以 可 以 拼接 在 一 起 ， 这 样 就 形 
成 了 一 个 11 个 比特 的 串 ， 占 用 了 两 个 字 节 的 存储 单元 。 然 后 到 了 成 员 
c， 在 代码 清单 6-13 中 ，c 的 位 宽 为 8 个 比特 ， 倘 若 与 a 和 b 拼 接 在 一 起 ， 那 
么 就 超过 双 字 节 的 存储 单元 ， 此 时 C 语 言 标准 允许 C 语 言 实现 做 一 个 选 
择 ， 让 成 员 c 放 在 下 一 个 存储 单元 ， 或 是 让 它 与 a 和 b 也 拼接 在 一 起 ， 那 
么 c 就 横 跨 了 两 个 存储 单元 〈 也 就 是 标准 所 提 到 的 登 交 存 放 的 情况 ) ， 
而 Apple LLVM 选 择 了 前 者 ， 即 让 成 员 c 存 放 在 下 一 个 单元 。 在 代码 清单 
6-14 中 ， 由 于 成 员 c 占 5 个 比特 ， 与 a 和 b 已 经 串 好 的 11 比 特 拼 接 在 一 起 
后 ， 形 成 16 比 特 串 ， 正 好 能 存放 在 当前 存储 单元 。 因 此 在 代码 清单 6-14 
中 ，a、b 和 c 都 在 同一 可 寻 址 存储 单元 。 








最 后 ， 为 了 让 各 位 对 可 寻 址 存储 单元 大 小 的 分 配 能 有 进一步 的 认 


识 ， 我 们 对 代码 清单 6-13 再 做 一 些小 修改 〈 见 代码 清单 6-15) ， 然 后 看 
看 结果 。 


代码 清单 6-15 ”将 成 员 b 和 c 均 改 为 int 类 型 





#include <stdio.h> 
#include <stdbool.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 
enum MyEnum 
ENUM1， 


ENUM2 ， 
ENUM3 


}; 
struct MyStruct 
{ 


























int32 t a : 6; // a 的 范围 为 [-32，31] 
int32 tb : 5; // b 的 范围 为 [-16，15] 
int32 tc : 8; // c 的 范围 为 [-128，127] 








char x : sizeof(enum MyEnum); 
bool y : 1; 


enum MyEnum e : ENUM3, 
}s = { Ox1i8, Ox0a, Ox77, '\1', true, ENUM3 }; 
// s 的 二进制 表示 : (000000) 10 1 0001 01110111 01010 011000 


// 整理 后 得 : 0000 0010 1000 1011 1011 1010 1001 1000 
printf("The size is: %zu\n", sizeof(s)); 














// 输出 9x928bba98 
printf("The content of s is: Ox%.8x\n", *(uint32 t*)&s); 








代码 清单 6-15 中 ， 我 们 将 成 员 b 与 成 员 c 类 型 普 升 到 int32_t 之 后 ， 它 
们 所 存放 的 可 寻 址 存储 单元 束 有 32 个 比特 之 多 。 此 时 ， 我 们 可 以 看 到 这 
样 就 能 将 此 结构 体 剩 余 位 域 成 员 全 都 装 入 其 中 ， 所 以 比特 填充 只 出 现在 


最 后 几 个 高 位 。 


6.4.3 ”匿名 位 域 


在 C11 标 准 中 ， 位 域 可 以 是 匿名 的 。 当 某 个 位 域 只 给 出 其 类 型 及 宽 
度 ， 而 不 给 出 标识 符 名 时 ， 该 位 域 则 称 为 匿名 位 域 。 匿 名 位 域 一 般 仅 用 
作 比 特 填 充 〈“ 通 币 C 语 言 的 实现 都 用 0 来 填充 ) ， 而 不 能 被 直接 访问 该 填 
充 区 域 。 而 当 匿 名 位 域 的 宽度 为 0 时 ， 则 表示 该 位 域 是 其 前 面 的 位 域 所 
组 成 的 存储 区 域 的 末尾 ， 即 作为 一 个 结束 标志 而 使 用 。 该 存储 区 域 的 后 
续 比 特 痢 将 被 填充 ， 其 下 面 的 位 域 都 将 作为 一 个 新 的 存储 区 域 。 下 面 我 
们 将 举 一 个 使 用 匿名 位 域 的 例子 ， 见 代码 清单 6-16。 











代码 清单 6-16 匿名 位 域 使 用 示例 





#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 
struct 


int32 t a : 8; 

// 这 重 使 用 了 一 个 匿名 位 域 ， 使 得 位 域 a 与 位 域 b 之 间 空 出 8 比特 ， 
// 并 且 这 空 出 的 8 比特 均 用 6 来 填充 

Int32 t: 8; 


int32 t b : 16; 


// 这 里 分 别 给 成 员 a 和 b 进 行 初始 化 
// 对 象 s 仍 然 具 有 两 个 成 员 (a 和 b) ， 中 间 填 充 部 分 无 法 访问 
}s = { Ox21, Ox6543 }; 

















































































































// 这 里 输出 : s is; 0x65430021 
printf("s is: QOx%.8X\n", *(Uuint32 t*)&s); 


struct 


int32 ta : 8; 

// 这 里 使 用 了 一 个 匿名 位 域 ， 且 宽 度 为 9， 

7 这 样 位 域 a 所 在 的 整个 区 城 后 名 走 都 将 被 9 填充 ， 然后 终结 该 区 
int32 t : 0; 


// 位 域 b 将 被 安排 在 位 域 a 的 下 一 个 存储 区 域 ， 而 不 会 跟 a 存 放 在 同一 区 域 
int32 t b : 16; 




















泛 












































// 下 面 的 x 与 y 都 会 与 位 域 b 存 放 在 同一 存储 区 域 
int16 t x : 8; 


Int16 ty : 8; 




















// 这 里 分 别 给 成 员 a，b，x， 和 y 进 行 初始 化 
}t = { Ox10, QOx4321, Ox65, Ox76 }; 




















// 这 里 输出 : t is: 0x7665432100000010 
printf("t is: Ox%.161]X\n", *(uint64 t*)e&t); 











} 





6.4.4 ”位 域 使 用 示例 


在 实践 中 ， 我 们 往往 把 需要 拼接 在 一 起 的 位 域 成 员 用 相同 类 型 或 相 
同 字 节 宽度 的 类 型 毗邻 排放 ， 这 样 可 以 避免 一 些 不 必要 的 比特 填充 ， 从 
而 能 够 获得 更 好 的 位 域 结 构 化 描述 。 我 们 下 面 举 一 个 关于 初中 学 生 信息 
部 分 属性 的 例子 来 描述 位 域 在 实践 中 的 使 用 方式 ， 如 代码 清单 6-17 所 








代码 清单 6-17 位 域 在 实践 中 的 使 用 





#include <stdio.h> 

#include <stdbool.h> 

#include <stdint.h> 

int main(int argc, const char * argv[]) 


struct Student 
{ 
































uint32_t grade : 2; // 年 级 (1-3， 对 于 初中 生 可 用 0 表示 预备 班 ) 
uint32_t class : 4; // 班级 ， 一 个 年 级 最 多 可 有 16 个 班级 
uint32_t number : 7; // 学 号 ， 一 个 班级 最 多 128 个 学 生 
uint32_t weight : 7; // 体重 ， 一 个 学 生 最 重 128kg 

uint32_t height : 8; // 身高 ， 一 个 学 生 最 高 256cm 

uint32_t isMale : 1; // true 表 示 男 生 ; false 表 示 女 生 
uint32_t age : 3 // 年 龄 (19 到 17 岁 ) 





}; 


// 声明 了 一 个 学 生 对 象 ，1 年 级 5 班 ，26 号 ，50kg，160cm， 男 生 ，14 岁 
Struct Student s = { 1, 5, 26, 50, 160, true }; 








printf("size is:%zu\n", sizeof(s)); 





代码 清单 6-17 中 我 们 定义 了 名 为 Student 的 一 个 结构 体 ， 整 个 结构 体 
的 大 小 为 4 个 字 节 ， 而 就 这 4 个 字 节 我 们 就 定义 了 一 个 学 生 的 7 个 属性 。 
由 于 在 这 个 学 生 的 结构 体 中 很 多 属性 不 需要 一 个 字 节 (8 比特 〉 来 表 
示 ， 而 只 要 很 少 几 个 比特 就 能 表示 其 范围 了 。 比 如 第 一 个 属性 “年 级 ”， 
一 所 中 学 的 年 级 一 般 为 1 到 3 年 级 ， 所 以 我 们 用 2 个 比特 就 能 表示 这 个 范 
围 ，2 比 特 的 无 符号 整数 可 表示 的 范围 是 0，3]。 这 里 ， 对 一 个 学 生 对 象 
s 初 始 化 的 各 个 属性 为 : 1 年 级 ，5 班 ， 学 号 为 26 号 ， 体 重 50kg， 身 高 
160cm， 男 生 ，14 岁 。 我 们 可 以 看 到 ， 通 过 位 域 可 以 将 信息 做 些 压缩 ， 
使 得 数据 对 象 信息 尽 可 能 少 地 占用 存储 空间 。 如 果 以 上 这 些 属性 都 要 用 
8 位 无 符号 整数 来 表示 (比如 像 Java 语 言 就 不 支持 位 域 )， 那 么 就 至 少 


十 要 2 人 于 人 





























6.5 ”他 节 对 齐 与 字 市 填充 








在 前 儿 节 我 们 已 经 提 到 了 一 些 关 于 字 市 对 齐 与 字 节 填充 的 使 用 场 
景 ， 本 市 将 详细 描述 C 语 言 中 的 字 市 对 齐 与 子 节 填充 。 








在 2.5 节 中 ， 我 们 已 经 大 致 描述 了 字 节 对 齐 这 个 概念 ， 并 解释 了 为 
何 计算 机 系统 需要 字 节 对 齐 。 由 于 C 语 言 是 非常 贴近 底层 硬件 的 高 级 编 
程 语言 ， 所 以 它 本 身 就 含有 诸多 字 节 对 齐 的 语法 特性 。 然 而 字 节 对 齐 对 
于 不 同 架 构 的 处 理 器 可 能 会 有 不 同 要 求 。 对 于 一 般 32/64 位 系统 环境 ， 
通常 编译 器 会 默认 对 指令 与 数据 做 4 字 节 对 齐 。 也 就 是 说 ， 一 个 函数 的 
起 始 地 址 以 及 一 个 数据 对 象 的 起 始 地 址 都 会 是 4 字 节 的 倍数 〈 比 如 地 址 
0x01001000，0x00400204 等 ) 。 而 像 在 ARM 处 理 喜 架构 下 ， 每 条 ARM 
指令 所 在 的 地 址 都 必须 是 4 字 节 对 齐 〈 即 4 字 节 的 倍数 ) ， 和 否则 执行 指令 
时 就 会 引发 异常 ， 而 在 AArch32 环 境 下 ， 对 每 个 函数 的 栈 起 始 地 址 要 求 
是 8 字 节 对 齐 〈 即 8 字 节 的 倍数 ) ， 由 于 这 样 能 优化 LDP 指 令 〈 用 于 一 下 
子 读 取 两 个 连续 的 4 字 节 字 的 操作 ) 对 数据 的 读 取 ， 而 在 AArch64 环 境 
下 ， 则 要 求 每 个 函数 的 栈 的 起 始 地 址 应 该 为 16 字 节 对 齐 。 























6.5.1 _Alignof 操 作 符 





在 C 语 言 中 ， 每 个 完整 的 对 象 类 型 都 具有 对 齐 要 求 。 所 谓 N 字 节 对 





齐 是 指 分 配 该 对 象 存储 空间 时 ， 其 起 始 地 址 必须 是 N 字 市 的 倍数 。 比 
如 ， 一 个 对 象 要 求 4 子 节 对 齐 则 意味 看 给 该 对 象 分 配 的 起 始 地 址 必须 能 
被 4 整除 。 尽 管 每 个 C 编 译 器 的 实现 对 于 对 齐 要 求 可 能 有 些 不 同 ， 不 过 在 
传统 的 果 面 环境 中 ， 一 般 基 本 数据 类 型 的 对 齐 参照 其 数据 类 型 本 喘 的 大 
小 。 比 如 ， 一 个 char 类 型 的 对 齐 要 求 为 1 个 字 节 ; 一 个 short 类 型 的 对 齐 
要 求 为 2 个 字 市 ; 一 个 int 类 型 的 对 齐 要 求 为 4 个 字 市 ， 等 等 。C11 标 准 引 


入 了 _Alignof 关 键 字 来 查看 当前 指定 对 象 的 对 齐 要 求 。 






































_Alignof 的 用 法 与 sizeof 类 似 ， 但 有 两 点 不 同 : 





1) sizeof 后 面 可 直接 跟 一 个 对 象 标识 符 而 不 需要 圆 括号 ， 但 
_Alignof 则 不 行 。_Alignof 后 面 必 须 跟着 一 对 圆 括号 ， 然 后 在 圆 括 号 里 
存放 操作 数 。 





2) _Alignof 的 操作 数 只 能 是 类 型 名 (基本 类 型 、 枚 举 类 型 、 结 构 
体 、 联 合体 等 ) ， 而 不 能 是 一 个 表达 式 〈 包 括 对 象 标识 符 都 不 行 ) 。 不 
过 GNU 语 法 扩展 能 使 得 _Alignof 的 操作 数 为 表达 式 ， 这 样 我 们 在 GCC、 
Clang 编 译 器 中 就 能 使 用 此 特性 。 





此 外 ，_Alignof 同 样 也 返回 一 个 size_t 类 型 的 值 表示 指定 类 型 的 对 齐 


顺应 C11 标 准 的 实现 都 应 该 含有 一 个 max_align_t 类 型 ， 表 示 当 前 实 
现 对 基本 对 齐 要 求 的 最 大 对 齐 的 文 持 。 如 果 某 个 C 语 言 实现 无 法 直接 使 





用 max_align_t， 那 么 可 以 通过 包含 <stddef.h> 头 文件 来 解决 。 所 谓 基本 
对 齐 要 求 是 指 C 语 言 编译 器 在 没有 受到 程序 员 指定 的 情况 下 自己 做 出 的 
默认 对 齐 要 求 。 比 如 上 面 提 到 的 char、short、int 类 型 的 默认 对 齐 要 求 。 
而 对 于 一 个 数组 或 一 个 结构 体 ， 如 果 它 们 的 存储 空间 非常 大 ， 此 时 编译 
器 将 会 按照 _Alignof (max_align_t〉 字 节 对 齐 要 求 对 它们 做 对 齐 。 
max_align_t 这 个 类 型 也 是 编译 器 自己 实现 的 ， 像 Apple LLVM 编 译 器 是 
将 它 定 义 为 long double 类 型 (大 小 为 16 字 市 ) ; 在 GCC、MSVC 与 VS- 
Clang 中 被 定义 为 double 类 型 (大 小 为 8 字 节 ) 。 此 外 ， 我 们 在 查询 对 齐 
要 求 的 时 候 可 以 引入 标准 头 文件 <stdalign.h>， 这 里 面 会 有 对 _Alignof 所 
定义 的 宏一 一 alignof。alignof 是 用 在 C++ 中 的 关键 字 ， 其 作用 与 C 语 言 的 
_Alignof 一 样 。 下 面 我 们 通过 代码 清单 6-18 来 看 看 _Alignof 的 具体 使 用 方 
3 




















代码 清单 6-18 ”_Alignof 的 使 用 





#include <stdio.h> 
#include <stdbool.h> 
#include <stdalign.h> 
#include <stddef.h> 


int main(int argc, const char * argv[]) 

















// 这 里 查询 当前 编译 器 的 最 大 对 齐 字 节 数 
size_t size = _Alignof(max_align_t); 
printf("Max alignment is:%zu\n", size); 


// 这 里 查询 布尔 类 型 的 对 齐 字 节 数 

// 我 们 引入 了 <stdalign. h> 头 文件 后 可 直接 使 用 alignof 
size = alignof (bool); 
printf("Boolean alignment is: %zu\n", size); 

































































// 定义 一 个 结构 体 S， 然 后 声明 一 个 变量 s 并 对 它 初始 化 











struct S 

{ 
int a; 
float f; 


double d; 


long double ld; 
}s = { 0, 1.0f, 10.5, 1000.0005L }; 


// 在 C11 标 准 中 ，alignof 操 作 数 必须 是 一 个 类 型 名 ， 不 能 是 一 个 表达 式 
// 所 以 这 里 只 能 用 alignof(struct S)， 而 不 能 用 alignof(s) 

size = alignof(struct S); 

printf("S alignment is: %zu\n", size); 






































6.5.2 _Alignas 对 齐 说 明 符 


6.5.1 节 介绍 的 是 类 型 默认 对 齐 以 及 _Alignof 操 作 符 的 使 用 。 但 在 很 
多 情况 下 ， 通 过 编译 器 的 默认 对 齐 方式 无 法 满足 对 齐 要 求 ， 尤 其 涉及 高 
性 能 计算 领域 时 ， 我 们 可 能 要 将 一 个 结构 体 或 一 个 数组 以 16 字 节 对 齐 其 
至 64 字 节 对 齐 的 方式 存放 。 





C11 标 准 引 入 了 对 齐 说 明 符 一 一 _Alignas 操 作 符 ， 用 于 显 式 指定 某 
个 对 象 以 多 少 字 节 对 齐 。_Alignas 操 作 符 的 用 法 与 _Alignof 类 似 ， 不 过 
_Alignas 的 操作 数 可 以 是 一 个 常量 表达 式 。 该 常量 表达 式 用 于 显 式 指明 
当前 指定 对 象 以 多 少 字 节 对 齐 。 另 外 与 _Alignof 类 似 的 是 ， 当 我 们 引入 
<stdalign.h> 头 文件 后 ， 我 们 可 直接 使 用 alignas 来 代替 _Alignas。 








一 般 C11 标 准 的 实现 对 _Alignas 操 作 数 也 有 一 些 约束 和 限制 : 








1) _Alignas 操 作 数 所 指定 的 字 节 对 齐 大 小 不 能 小 于 当前 C 语 言 实现 
默认 的 对 齐 大 小 。 比 如 ， 一 个 int 对 象 的 默认 对 齐 大 小 如 果 是 4 字 节 ， 那 
么 当 我 们 使 用 _Alignas (1) inta; 来 声明 对 象 a 的 时 候 ， 编 译 器 可 能 会 


报错 。 


2) _Alignas 的 操作 数 应 该 是 0(、1、2、4 等 无 符号 整数 。 当 其 操作 数 
大 于 4 时 ， 该 操作 数 必须 是 4 的 倍数 ， 否 则 编译 器 可 能 报错 。 比 如 ， 
_Alignas (5) ，_Alignas (10) 均 可 能 是 无 效 的 对 齐 说 明 符 。 当 
_Alignas 的 操作 数 为 0 时 ， 表 示 忽 略 此 对 齐 说 明 符 ， 此 时 编译 器 将 会 以 默 
认 方 式 对 指定 对 象 采 取 字 节 对 齐 要 求 。 











3) 编译 器 实现 一 般 都 会 对 对 齐 说 明 符 指 定 一 个 最 大 可 对 齐 的 字 节 
数 ， 在 Apple LLVM 编 译 器 中 指定 为 256MB， 如 果 _Alignas 的 操作 数 的 值 
超过 256x1024x1024， 那 么 编译 器 将 会 报错 。 


此 外 ， 在 一 个 对 象 声 明 符 中 ， 可 多 次 使 用 对 齐 说 明 符 ， 如 果 在 一 条 
声明 语句 中 存在 多 个 对 齐 说 明 符 ， 则 声明 的 对 象 将 按照 最 大 指定 的 对 齐 
字 节 数 来 对 齐 。 








下 面 ， 我 们 将 通过 代码 清单 6-19 来 描述 对 齐 说 明 符 的 用 法 以 及 效 
果 。 为 了 观察 实际 使 用 对 齐 说 明 符 后 的 效果 ， 我 们 需要 动用 GNU 语 法 扩 
展 ， 所 以 清单 6-19 中 的 代码 大 家 需要 在 GCC 或 Clang 编 译 器 中 尝试 。 


代码 清单 6-19 _Alignas 操 作 符 的 使 用 及 效果 





#include <stdio.h> 
#include <stdbool.h> 
#include <stdalign.h> 


int main(int argc, const char * argv[]) 











// 这 里 声明 了 :int 类 型 对 象 a1， 并 观察 其 默认 的 对 齐 字 节 数 
int al = 0; 

size_t align = alignof(a1); 

printf("ai alignment is: %zu\n", align); 


// 用 double 对 齐 属性 来 给 int 类 型 对 象 a2 做 字 节 对 齐 。 

// Alignas 对 齐 说 明 符 可 以 放 在 类 型 后 面 ， 对 象 标识 符 前 
int _Alignas(double) a2 = 0; 

align = alignof(a2); 

printf("a2 alignment is: %zu\n", align); 


// int 类 型 对 象 a3 的 对 齐 有 些 复杂 ， 

// 它 是 从 int、double 以 及 指定 的 64 字 节 对 齐 这 三 种 对 齐 方式 中 ， 
// 选 出 最 大 对 齐 字 节 数 的 那个 作为 对 齐 要 求 

alignas(int) alignas(double) alignas(64) int a3 = 0; 
align = alignof(a3); 

printf("a3 alignment is: %zu\n", align); 


// 这 里 ， 对 对 象 d 采 用 指定 为 9 的 对 齐 ， 那 么 它 仍 然 用 默认 的 对 齐 方 式 
double alignas(0) d = 0; 

align = alignof(d); 

printf("d alignment is: %zu\n", align); 


// 这 里 演示 了 当 我 们 吃 不 准 当前 环境 某 一 类 型 对 象 的 基本 对 齐 要 求 时 ， 


































































































































































































// 我 们 可 以 使 用 条 件 表达 式 来 判断 我 们 要 求 的 对 齐 字 节 
// 我 们 选取 自己 要 求 的 对 齐 字 节 数 与 基本 对 齐 要 求 字 节 数 之 间 的 最 大 什 
































数 是 否 小 于 基本 对 齐 要 求 ， 


long long alignas(alignof(long long) > 8 ? alignof(long long) 


11 = OLL; 
align = alignof(11); 
printf("]11 alignment is: %zu\n", align); 


// 对 齐 说 明 符 也 能 修饰 一 个 结构 体 成 员 


struct 


// 这 里 ， 成 员 对 象 a 以 16 字 节 对 齐 
int alignas(16) a; 
int b; 


}s = {0, 0}; 


printf("s size is: %zu\n", sizeof(s)); 
printf("s alignment is: %zu\n", alignof(s)); 

















// 这 条 声明 语句 是 错误 的 。 

// 因为 一 般 桌 面 环境 中 ，int 类 型 的 基本 对 齐 要 求 字 节 数 为 4 字 节 ， 
// 而 这 里 指定 的 字 节 对 齐 要 求 为 1 个 字 节 ， 小 于 4 字 节 的 基本 对 齐 要 求 
int alignas(char) err = 0; 

































































: 8) 


代码 清单 6-19 展 示 了 _Alignas 操 作 符 的 在 干 种 用 法 。 包 括 显 式 指定 
对 齐 大 小 与 默认 对 齐 大 小 的 区 别 ， 由 _Alignas 引 出 的 对 齐 说 明 符 放置 的 





位 置 〈 可 在 类 型 名 之 后 ， 但 必须 在 对 象 标 识 符 之 前 ) 








中 同时 存在 多 个 对 齐 说 明 符 的 情况 ， 以 及 _Alignas 操 作 数 使 用 党 


式 的 情况 。 


在 


让 


声明 语句 


量 表达 


通过 以 上 两 个 例子 ， 我 们 应 该 能 够 基本 掌握 在 C11 标 准 中 如 何 查 询 
茶 个 类 型 的 对 齐 字 市 数 以 及 如 何 自 己 指定 茶 个 对 象 的 对 齐 字 市 数 。 





6.5.3 ”结构 体 成 员 的 字 节 对 齐 与 字 市 填充 


下 面 我 们 将 介绍 结构 体 成 员 的 字 市 对 齐 以 及 字 节 填充 。C 语 言 中 ， 
结构 体 的 字 节 填充 一 般 也 是 根据 其 成 员 的 对 齐 情况 来 确定 的 。C11 标 准 
只 是 提 到 了 一 个 结构 体 或 联合 体 对 象 的 每 个 非 位 域 成 员 ， 以 实现 定义 
的 、 适 合 该 成 员 对 象 类 型 的 方式 进行 对 齐 ; 在 一 个 结构 体 或 联合 体 的 末 
尾 可 以 做 字 市 填充 。 因 此 ， 结 构 体 成 员 的 字 节 对 齐 以 及 字 节 填充 也 主要 
根据 C 编 译 絮 上 自身 的 实现 而 定 。 对 于 当前 时 面 系统 上 的 主流 C 语 言 编译 
名 而 言 ， 主 要 遵守 以 下 规则 来 判定 每 个 成 员 的 字 节 对 齐 与 填充 : 




















— 


1) 结构 体 第 一 个 成 员 所 在 的 偏 移 地 址 为 0〈 即 从 0 开始 计 〉。 








a 


2) 每 个 成 员 根据 其 类 型 或 程序 员 指定 的 对 齐 字 节 数 来 判定 它 所 在 
的 侦 移 地 址 。 如 宋 该 成 员 要 求 4 字 节 对 齐 ， 那 么 它 所 处 的 侦 移 地 址 就 应 
该 是 4 的 倍数 ， 如 果 不 是 4 的 倍数 ， 则 同上 取 不 小 于 当前 侦 移 值 的 4 的 倍 


数 的 最 小 整数 。 


3) 确定 了 当前 成 员 对 象 的 偏 移 地 址 之 后 ， 它 的 起 始 地 址 到 前 一 个 
对 象 之 间 空 日 的 存储 空间 用 0 来 填充 。 














4) 结构 体 对 象 的 字 市 对 齐 要 求 与 其 成 员 中 最 大 字 节 对 齐 要 求 相 一 
致 。 





代码 清单 6-20 给 出 了 C 编 译 右 默认 对 齐 情况 的 结构 体 成 员 字 市 对 齐 
与 填充 。 








代码 清单 6-20 默认 对 齐 的 结构 体 成 员 字 节 对 齐 与 填充 





#include <stdio.h> 
#include <stdalign.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 
struct 


int8_t c; 
int32_t i; 
Int16 t s,; 
int64 t d; 
}s = { Ox10, Ox20, Ox30, Ox40 }; 


printf("s alignment: %zu\n", alignof(s)); 
printf("size is: %zu\n", sizeof(Ss)); 





代码 清单 6-20 中 声明 了 一 个 匿名 结构 体 对 象 ， 其 成 员 有 c、i、s 和 和 
d。 这 里 ， 成 员 c 以 1 个 字 节 对 齐 ; 成 员 i 以 4 个 字 节 对 齐 ; 成 员 s 以 2 个 字 节 
对 齐 ; 成 员 d 以 8 个 字 节 对 齐 。 根 据 规则 4， 该 结构 体 对 象 s 是 以 8 字 节 对 
齐 的 〈 即 对 齐 要 求 与 其 成 员 d 一 致 ) ， 而 s 的 大 小 为 24 个 字 节 。 





我 们 下 面 来 分 析 一 下 代码 清单 6-20 中 匿名 结构 体 中 成 员 的 字 节 对 齐 
情况 ， 见 表 6-1。 





表 6-1 代码 清 单 6-20 中 匿名 结构 体 成 员 布 局 


成 员 对 象 标识 符 占用 存储 空间 大 小 偏 移 量 地 址 
c .| | 








表 6-1 列 出 了 结构 体 中 每 个 成 员 的 侦 移 地 址 、 对 齐 字 节 数 以 及 占用 
存储 空间 大 小 。 


1) 对 象 c 类 型 为 int8_t， 所 以 占 1 个 字 节 大 小 ， 对 齐 要 求 为 1 字 节 。 
由 于 它 古 第 一 个 成 员 ， 所 以 存放 在 偏 移 地 址 0 单元 处 。 





2) 对 象 是 第 二 个 成 员 ， 它 是 int32_t 类 型 ， 占 4 个 字 节 ， 因 此 对 齐 要 
求 为 4 字 节 。 由 于 偏 移 地 址 1 不 是 4 的 倍数 ， 所 以 需要 向 上 找 4 的 倍数 的 最 
小 整数 ， 这 样 正 好 是 偏 移 地 址 4， 那 么 成 员 ji 就 占用 了 偏 移 地址 单元 4 到 
7， 而 偏 移 地 址 单元 1 到 3 正好 是 空 出 来 的 ， 用 0 来 填充 。 


3) 对 象 s 是 第 三 个 成 员 ， 类 型 为 int16 t， 占 2 个 字 节 ， 因 此 对 齐 要 
求 也 是 2 个 字 节 。 由 于 偏 移 地 址 8 满足 2 的 倍数 ， 因 此 s 就 存放 在 偏 移 地 址 
8 处 ， 并 占用 偏 移 地 址 单元 8 和 9。 





4) 对 象 d 是 第 四 个 成 员 ， 它 是 int64_t 类 型 ， 占 用 8 个 字 节 ， 在 
Clang、GCC 与 MSVC 中 的 对 齐 要 求 也 是 8 字 节 。 由 于 偏 移 地 址 10 不 满足 
8 的 倍数 ， 因 此 需要 向 上 找到 是 8 的 倍数 的 最 小 整数 ， 因 此 它 被 存放 在 偏 
移 地 址 16 处 ， 并 占用 偏 移 地 址 单元 16 到 23。 











由 上 可 知 ， 整 个 结构 体 对 象 的 大 小 就 是 24 字 节 。 下 面 图 6-2 展 示 了 


结构 体 对 象 s 的 存储 布局 ， 该 图 是 在 Apple LLVM 8.0 编 译 环 境 下 通过 
Xcode 集成 开发 环境 捕获 到 的 。 
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图 6-2 ”结构 体 对 象 s 的 存储 布局 





图 6-2 中 ， 每 个 数 都 是 十 六 进 制 的 ， 表 示 一 个 字 节 。 以 紧 线 划分 4 个 
字 节 为 一 组 ， 这 样 容 易 观 察 。 其 中 ， 数 值 0x10 处 于 仿 移 地 址 单元 0 处 ; 
数值 0x40 在 偏 移 地 址 16 处 。 通 过 这 个 图 我 们 可 以 很 直观 地 看 清 字 市 填充 
与 对 齐 的 实现 。 





此 外 ， 在 C 语 言 标准 中 还 有 一 个 offsetof 宏 ， 用 于 获取 当前 成 员 所 在 
的 偏 移 位 置 。 它 定义 在 <stddef.h> 头 文件 中 。 代 码 清单 6-21 展 示 了 它 的 用 
法 。 


代码 清单 6-21 ”offsetof 的 使 用 





#include <stdio.h> 

#include <stddef.h> 

#include <stdalign.h> 

#include <stdbool.h> 

int main(int argc, const char * argv[]) 


struct S 
int16 t s; 


// 这 里 对 象 b 按 照 Int32_t 类 型 的 对 齐 要 求 进行 对 齐 ， 即 4 字 节 对 齐 
alignas(int32_t) bool b; 



































int32_t i; 


// 这 里 定义 了 一 个 匿名 联合 体 ， 并 用 它 声明 一 个 对 象 un 
// un 按照 16 字 节 对 齐 。 
// 这 里 需要 注意 ，un 的 对 齐 说 明 符 的 值 不 能 小 于 8， 因 为 其 成 员 最 大 对 齐 字 节 数 为 8 


alignas(16) union 



















































































// 指定 成 员 c 的 对 齐 要 求 为 8 字 节 对 齐 
alignas(8) char c; 
float f; 
}un, // un 的 大 小 为 4 字 节 ， 且 按 16 字 节 对 齐 
}; 


size _t offset = offsetof(struct S, s); 
printf("s offset is: %zu\n", offset); 




















offset = offsetof(struct S, b); 
printf("b offset is: %zu\n", offset); 


offset = offsetof(struct S, 1i); 
printf("i offset is: %zu\n", offset); 


offset = offsetof(struct S, un); 
printf("un offset is: %zu\n", offset); 


printf("S alignment is: %zu\n", alignof(struct S)); 





以 上 我 们 描述 了 结构 体内 的 成 员 对 齐 以 及 字 市 填充 ， 而 之 前 所 到 
过 ，C 语 言 标准 允许 实现 对 结构 体 或 联合 体 的 末尾 做 字 市 填充 ， 而 填充 
大 小 也 是 由 实现 定义 的 。 一 般 来 说 ， 结 构 体 末尾 的 填充 根据 该 结构 体 当 
前 成 员 最 大 对 齐 字 节 数 进行 填充 。 比 如 ， 如 果 当 前 成 员 的 最 大 对 齐 字 节 
数 为 8 字 节 ， 那 么 倘 知 当前 结构 体 的 大 小 不 满足 8 字 节 的 倍数 ， 则 填充 满 
8 字 市 的 倍数 为 止 。 换 句 话 说 ,结构 体 对 象 的 大 小 应 该 是 其 对 齐 字 节 数 
的 倍数 。 因 此 ， 当 确定 一 个 结构 体 最 后 一 个 成 员 的 位 置 与 大 小 之 后 ， 后 
面 所 填充 的 字 市 需要 保证 整个 结构 体 的 大 小 正好 与 其 对 齐 字 市 数 成 倍数 
关系 。 我 们 下 面 来 看 代码 清单 6-22 所 举 的 一 个 例子 。 



































代码 清单 6-22 ”结构 体 末 尾 字 节 填充 





#include <stdio.h> 
#include <stddef.h> 
#include <stdalign.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 


Struct S 




















int i; // 偏 移 地 址 为 96; 大 小 为 4 字 节 ; 4 字 节 对 齐 
alignas(64) long double 1d; // 偏 移 地 址 为 64; 大 小 为 16 字 节 ; 64 字 节 对 齐 
Char- es // 偏 移 地 址 为 80; 大 小 为 1 字 节 ; 1 字 节 对 齐 



































}; 


printf("S alignment is: %zu\n", alignof(struct S)); 
printf("S size is: %zu\n", sizeof(struct S)); 


Size _t offset = offsetof(struct S, i); 
printf("i offset: %zu\n", offset); 


offset = offsetof(struct S, 1d); 
printf("1d offset: %zu\n", offset); 


offset = offsetof(struct S, c); 
printf("c offset: %zu\n", offset); 
struct s2 
{ int 1; 
char x, y, ZzZ, w; 
printf("S2 alignment is %zu\n", alignof(struct S2)); 


printf("S2 size is %zu\n", sizeof(struct S2)); 
printf("w offset: %zu\n", offsetof(struct S2, w)); 











代码 清单 6-22 中 可 清晰 看 到 ， 由 于 结构 体 S 的 最 大 对 齐 字 节 数 的 成 

员 ]ld 为 64 字 市 对 齐 ， 所 以 结构 体 S 的 对 齐 要 求 即 为 64 字 节 。 当 成 员 c 放 置 
在 偏 移 地 址 80 之 后 ， 需 要 在 末尾 填充 值 为 0 的 字 节 ， 一 直到 结构 体 S 的 大 
小 能 满足 64 的 倍数 为 止 。 因 此 结构 体 5 的 最 终 大 小 为 128 字 市 。 而 对 于 结 
构 体 S2， 其 最 大 对 齐 成 员 类 型 为 int， 也 就 是 对 象 ， 因 此 它 也 以 4 字 节 要 
求 对 齐 。 最 后 4 个 x、y、z、w 成 员 痢 是 单字 节 对 象 ， 因 此 均 满足 对 齐 要 
求 ， 所 以 S2 中 的 所 有 成 员 都 不 存在 字 市 填充 的 情况 。 此 外 ，S2 大 小 在 默 
认 情 况 下 已 经 是 8 字 节 了 ， 满 足 4 字 市 要 求 对 齐 的 倍数 ， 因 此 在 w 成 员 之 
后 也 不 需要 额外 的 字 市 填充 。 





























6.6 ”复数 类型 








之 前 我 们 在 第 5 章 给 大 家 介绍 了 整数 类 型 与 浮 点 数 类 型 ， 这 两 种 类 
型 统称 为 实数 类 型 。 本 节 我 们 将 给 大 家 介绍 复数 〈complex number) 类 
型 。 之 所 以 在 这 里 介绍 复数 类 型 是 因为 复数 本 身 就 是 一 个 复合 类 型 ， 我 
们 知道 一 个 复数 是 由 实 部 和 虚 部 构成 的 ， 因 此 在 C 语 言 中 一 个 复数 对 象 
也 有 具有 两 个 成 员 ， 一 个 表示 复数 的 实数 部 分 ， 另 一 个 表示 复数 的 虚数 部 


分 。 











复数 类 型 从 C99 标 准 开 始 引 入 ， 并 且 复 数 的 实 部 与 虚 部 的 数据 类 型 
只 能 是 float、double 与 long double 这 三 种 浮 点 类 型 。 遵 循 GNU 语 法 扩展 
的 C 语 言 实现 允许 复数 类 型 为 整数 类 型 ， 因 此 在 GCC 与 Clang 编 译 器 中 都 
能 使 用 整数 类 型 的 复数 。 声 明 一 个 复数 对 象 时 ， 使 用 _Complex 关 键 字 ， 
再 加 浮 点 类 型 。 比 如 ， 我 们 要 声明 一 个 实 部 与 虚 部 都 为 float 单 精度 浮 点 
类 型 的 复数 ， 使 用 float_Complex comp; 。 这 里 ， 关 键 字 _Complex 与 类 
型 名 可 以 互 换 位 置 。 





我 们 在 使 用 复数 时 ， 一 般 需 要 包含 头 文件 <complex.h>。 此 头 文件 
包含 了 诸多 对 复数 进行 操作 的 库 函 数 ， 包 括 取 复数 的 实 部 和 虚 部 的 值 等 
。 此 外 ， 这 个 头 文件 中 还 定义 了 _Complex 的 简化 、 标 准 形 式 
complex。 因 此 ， 我 们 后 面 可 直接 用 complex 来 声明 一 个 复数 对 象 ， 这 样 








既 简 洁 ， 而 且 又 能 跨 平 台 。 比 如 像 当 前 的 MSVC 并 不 直接 支持 复数 类 
型 ， 但 支持 <complex.h> 标 准 库 头 文件 ， 并 以 结构 体 方式 给 出 复数 实 
现 。 要 表示 一 个 复数 字面 量 可 以 直接 用 算术 表达 式 ， 比 如 3.0f+0.5fi 表 示 
一 个 实 部 为 3.0、 虚 部 为 0.5 的 一 个 单 精度 浮 点 型 复数 。 这 里 ， 后 级 或 表 
示 复 数 的 虚 部 ， 一 般 建议 使 用 大 写 的 [， 这 也 是 在 <complex.h> 所 定义 的 
表示 虚 部 的 后 级。I 可 以 放 在 表示 单 精度 浮 点 的 后 缀 f 之 前 ， 比 如 0.5If 也 
是 合法 的 。 此 外 ， 虚 部 也 可 以 写成 诸如 0.5f*I 这 样 的 表达 式 。 复 数 除了 
上 述 这 种 直接 写 表达 式 的 形式 之 外 也 可 以 像 结构 体 对 象 那样 初始 化 ， 比 
如 : float_Complex comp={3.0f，0.5f}; ， 这 里 复数 对 象 comp 的 实 部 为 
3.0f、 虚 部 为 0.5f。 











上 面 我 们 描述 了 复数 对 象 的 声明 方法 以 及 初始 化 方式 。 除 了 上 述 这 
些 特性 外 ， 复 数 类 型 也 支持 类 似 于 结构 体 那样 的 复合 字面 量 。 比 如 ， 
(float_Complex)〉{-1.25f，2.75f} 表 示 一 个 实 部 为 1.25、 虚 部 为 2.75 的 单 
精度 浮 点 复数 对 象 。 








遵循 GNU 语 法 扩展 的 编译 器 可 和 直接 通过 _real “操作 符 来 获取 复数 
的 实 部 ， 通 过 _imag_ 操作 符 来 获取 复数 的 虚 部 。 这 两 个 操作 符 的 操作 
数 应 该 是 一 个 复数 类 型 的 对 象 ， 且 操作 数 中 的 计算 副作用 仍然 会 保留 ， 
这 点 跟 sizeof 操 作 符 有 所 不 同 。 如 果 _real 与 _imag 的 操作 数 是 一 个 
实数 ， 那 么 该 实数 将 会 被 隐 式 地 转 为 一 个 复数 ， 该 复数 的 实 部 与 实数 相 
同 〈 除 非 涉及 浮 点 数 的 转换 ， 那 么 精度 可 能 会 有 所 影响 ) ; 虚数 部 分 可 





以 是 正 0〈 对 于 浮 点 数 而 言 ) 或 无 符号 的 0。 当 我 们 引入 了 头 文件 
<complex.h> 之 后 ， 我 们 可 以 使 用 标准 库 的 crealf、creal 和 creall 来 获取 复 
数 的 实 部 ，crealf 函 数 用 于 获取 类 型 为 单 精度 浮 点 (float〉 的 复数 的 实 
部 ，creal 用 于 获取 类 型 为 双 精 度 浮 点 (double〉 的 复数 的 实 部 ，creall 用 
于 获取 类 型 为 扩展 双 精 度 浮 点 (long double) 的 复数 的 实 部 。 而 
cimagf、cimag、cimagl 这 些 库 函 数 则 用 于 获取 复数 的 虚 部 。 其 中 ， 
cimagf 用 于 获取 类 型 为 单 精度 浮 点 的 复数 的 虚 部 ，cimag 用 于 获取 类 型 
为 双 精 度 浮 点 的 复数 的 虚 部 ，cimagl 用 于 获取 类 型 为 扩展 双 精 度 浮 点 的 
复数 的 虚 部 。 此 外 ， 头 文件 <complex.h> 还 包含 了 用 于 计算 复数 的 三 角 
函数 、 对 数 等 多 种 库 函 数 工具 。 











复数 的 加 减 乘除 四 则 运算 与 实数 一 样 ， 可 直接 通 3 这些 
运算 符 进 行 计算 。 此 外 ， 一 个 复数 可 以 转换 为 一 个 实数 ， 此 时 复数 的 实 
数 部 分 转 为 实数 〔 数 据 类 型 转换 遵循 实数 的 类 型 转换 规则 〉 ， 而 虚数 部 
分 则 完全 舍弃 。 复 数 之 间 不 能 判别 大 小 ， 但 可 以 判别 是 否 相等 。 下 面 我 
们 将 举 一 些 例子 来 描述 复数 的 一 些 使 用 方法 ， 见 代码 清单 6-23。 





代码 清单 6-23 ”复数 的 使 用 





#include <stdio.h> 
#include <stdbool.h> 
#include <complex.h> 


int main(int argc, const char * argv[]) 
声明 了 一 个 单 精度 浮 点 型 复数 对 象 comp， 
7 并 用 一 个 复数 计算 表达 式 对 它 进行 初始 化 
float complex comp = 2.5f + 1.5fI; 


// 对 复数 comp 的 虚 部 加 3 .0f 























comp += 3.0f * I; 


// 对 复数 comp 的 实 部 加 9 .5f 
comp += 0.5f; 


// 分 别 获取 复数 comp 的 实 部 和 虚 部 
float r = crealf(comp); 

float i = cimagf(comp); 

printf("r = %f, i = %f\n", r, 1); 


// 这 里 声明 一 个 双 精 度 浮 点 型 的 复数 对 象 cComp2， 
// 并 用 类 似 结构 体 的 方式 对 它 进行 初始 化 ， 其 实 部 为 10.5、 虚 部 为 0.5 
double complex comp2 = {10.5, 0.5}; 















































: = creal(comp2); 
i = cimag(comp2); 
printf( = %f, i = %f\n", r, i); 


// 这 里 声明 了 一 个 扩展 双 精 度 浮 点 型 的 复数 对 象 comp3， 
// 然后 没有 直接 对 它 进 行 初始 化 
long double complex comp3 


// 这 里 用 一 个 扩展 双 精 度 浮 点 型 的 复数 字面 量 赋值 给 comp3 
comp3 = (float complex){ -1.25L, 2.75L }; 


// 分 别 获取 comp3 的 实 部 与 虚 部 

r = creall(comp3); 

i = cimagl(comp3); 

printf("r = %f, i = %f\n", r, 1i); 


// 这 里 复数 comp2 直 接 转 为 double 类 型 ， 然 后 赋值 给 f 变 量 。 
// 此 时 ，comp2 的 实 部 将 double 类 型 转 为 float 类 型 赋值 给 f， 并 
float f = comp2; 

printf("f = %f\n", f); 


// 可 以 将 一 个 实数 直接 赋值 给 一 个 复数 对 象 ， 

// 这 里 将 整数 100 转 换 为 float 类 型 ， 然 后 赋值 给 复数 的 实数 部 分 ， 其 虚数 部 分 为 0 

comp = 100; 

printf("comp real is: %f, imag is: %f\n", crealf(comp), cimagf (comp)); 


// 这 里 对 comp2 做 复数 的 四 则 运算 
comp2 = (comp2 + (0.25 - 3.0I)) / comp3; 
printf("comp2 real is: %f, imag is: %f\n", creal(comp2), cimag(comp2)); 


// 复数 之 间 不 能 用 >、>=、<、<= 来 比较 大 小 ， 但 可 以 使 用 == 及 != 来 判断 是 否 相 等 
bool b = comp == (float complex){100.0f, 0.0ofI}; 
printf("Is equal? %d\n", b); 
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代码 清单 6-23 展 示 了 上 述 所 讲 的 关于 复数 使 用 的 一 些 基 本 语法 特 
包括 对 复数 的 初始 化 、 赋 值 、 复 合 字面 量 、 获 取 实 部 与 虚 部 、 四 则 
运算 、 比 较 是 否 相等 、 与 实数 之 间 的 转换 等 。 





C11 标 准 还 提供 了 C 语 言 编译 占 可 选 实现 的 _Imaginary 类 型 ， 表 示 纯 


虚数 。 不 过 这 个 特征 没有 被 当前 主流 编译 占 的 任何 一 球 所 支持 ， 这 里 不 
做 展开 介绍 。 不 过 其 用 法 与 _Complex 差 不 多 ， 只 不 过 表示 的 数据 对 象 为 
一 个 纯 虚 数 。 如 果 纯 虚数 类 型 被 C 编 译 旨 文 持 ， 那 么 在 <complex.h> 头 文 
件 中 我 们 也 能 直接 使 用 imaginary。 不 过 由 于 complex 所 引入 的 复数 类 型 
己 经 涵盖 了 纯 虚 数 ， 所 以 一 般 纺 译 需 也 不 会 再 去 文 持 imaginary。 


6.7 ”本章 小 结 





本 章 给 大 家 介绍 了 枚 举 、 结 构 体 、 联 合体 等 用 户 自 定义 类 型 ， 其 中 
结构 体 又 称 为 聚合 类 型 。 最 后 又 介绍 了 复数 类 型 。 自 此 ，C 语 言 中 的 对 
象 类 型 就 已 经 全 部 介绍 完了 。 其 他 出 现 的 类 型 都 将 是 这 些 对 象 类 型 的 引 
申 。 





下 一 章 我 们 将 介绍 C 语 言 中 的 一 个 重点 语法 一 一 指针 。 它 是 数据 对 
象 的 一 个 属性 ， 并 且 伴随 着 本 章 与 第 5 章 所 介绍 的 类 型 。 














第 7 草 C 语 言 的 数组 与 指 计 


本 章 将 介绍 C 语 言 中 的 数组 与 指针 。 有 不 少 程序 员 都 称 C 语 言 中 的 
指针 是 整个 C 语 言 的 精 骨 ,尽管 个 人 认为 C 语 言 的 真正 精髓 是 其 整个 类 
型 系统 (type system) ， 但 指针 确实 也 扮演 着 非常 核心 的 角色 。 所 以 对 
于 C 语 言 初 学 者 来 说 ， 学 好 指针 是 十 分 关键 的 。 





本 章 将 先 介绍 C 语 言 中 的 数组 ， 然 后 介绍 指针 以 及 指针 与 数组 的 关 
系 ， 随 后 再 介绍 一 下 C 语 言 的 字符 串 字 面 量 ， 最 后 介绍 C 语 言 的 完整 类 
型 与 不 完整 类 型 。 其 中 ， 数 组 与 指针 都 属于 对 象 类 型 的 一 个 类 别 
(category) ， 其 中 数组 与 结构 体 一 样 ， 也 属于 聚合 类 型 。 








7.1 一 维 数 组 





一 维 数组 是 C 语 言 中 比较 常用 的 聚合 类 型 ， 它 表示 一 组 具有 相同 类 


型 的 多 个 元 素 的 有 序 组 合 。 声 明 一 个 一 维 数组 的 基本 形式 为 : 





< 类 型 名 > < 对 象 标 识 符 > [ < 数组 元 素 个 数 > ]; 


其 中 ， 数 组 元 素 个 数 可 以 是 一 个 计算 表达 式 。 在 C99 之 前 ， 计 算 表 
达 式 必须 是 一 个 整数 第 量 表 达 式 ， 而 在 C99 之 后 ， 它 可 以 不 必 为 整数 第 
量 表达 式 ， 一 个 需要 在 运行 时 计算 的 整数 变量 表达 式 也 能 用 来 指定 一 个 
数组 的 元 素 个 数 。 如 果 指 定数 组 长 度 的 表达 式 是 一 个 变量 ， 或 者 需要 在 
运行 时 才能 确定 的 值 ， 那 么 该 数组 又 被 称 为 变 长 数组 (variable length 
array) ， 这 将 在 后 续 的 7.3 市 中 做 详细 介绍 。 表 示 数 组 元 素 个 数 的 常量 
表达 式 的 值 应 该 是 一 个 正 整 数 ， 而 在 GNU 语 法 扩展 中 ， 人 允许 这 里 的 常量 
表达 式 为 0， 表 示 一 个 长 度 为 0 的 空 数组 ， 该 数组 对 象 占用 0 个 字 节 的 存 
储 空间 。 








由 于 数组 由 一 个 或 多 个 相同 类 型 的 对 象 组 成 ， 所 以 我 们 可 以 访问 数 
组 对 象 中 的 任 一 元 素 。 访 问 数 组 的 某 一 元 素 时 ， 我 们 使 用 数组 对 象 标识 
符 ， 然 后 后 面 加 得。 其 中 ， 数 组 对 象 标识 符 是 一 个 后 级 表达 式 ，[] 是 一 
个 下 标 操作 符 (subscript operators) ， 它 是 一 个 单 目 操作 符 ， 其 前 面 的 


后 绥 表 达 式 则 作为 它 的 操作 数 。 后 表示 的 是 数组 下 标 ， 数 组 下 标 中 可 以 





指定 整数 第 量 表达 式 或 整数 变量 作为 指定 当前 的 数组 元 系 索 引 

Gindex) ， 比 如 上 面 D 中 的 1。 数组 下 标 索 引 值 可 以 是 正 数 ， 也 可 以 十 负 
数 ， 或 者 0。 负 数 索 引 值 一 般 用 于 指针 对 象 ， 而 不 直接 用 于 数组 对 象 本 
身 。 访 问 数组 对 象 的 第 1 个 元 素 时 ， 使 用 下 标 [0]， 访 问 第 2 个 元 素 使 用 下 
标 [1]， 然 后 依 此 类 推 。 








对 一 个 数组 对 象 的 初始 化 使 用 {}， 作 为 其 初始 化 器 ， 里 面 存 放 相 应 
元 素 进 行 初始 化 的 初始 化 絮 列 表 。 如 果 列 表 长 度 小 于 数组 本 里 的 长 度 ， 
那么 后 面 多 出 来 的 元 素 部 分 被 初始 化 为 0。 从 C99 标 准 开 始 ， 可 以 通过 指 
定数 组 下 标的 方式 为 数组 元 系 进 行 初 始 化 ， 这 也 被 称 为 受 指 定 的 初始 化 


句 (designated initializer) 。 
下 面 举 一 些 简单 的 例子 来 描述 一 维 数 组 的 对 象 声 明 以 及 对 其 元 系 的 
访问 。 


代码 清单 7-1 一 维 数组 的 初始 化 及 元 素 访问 





#include <stdio.h> 

#include <stdbool.h> 
#include <complex.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 
// 声明 一 个 含有 5 个 类 型 为 char I 象 C， 


// 并 分 别 用 'a'、'b'、'c'、 ' 对 I 
char c[2*2+1]={ 'a' ‘pr 'c', 'd', 'e' } 
































// 分 别 将 数组 c 的 第 1 个 元 素 到 第 5 个 元 素 的 值 打印 出 来 
printf("c[0] = %c, c[1] = %c, c[2] = %c, c[3] = %c, c[4] = %c\n" 
cI], [4], c[21, cI3l, ct4]); 


// A et nn 
// 并 分 别 用 100， 0 对 它 进行 初始 化 ， 

// 数组 的 初始 化 列 妥 末尾 包 可 以 深加工 个 入 外 的 到 号 
int32_t a[4] = { 100, -1, }; 









































// 将 数组 a 的 第 1 个 到 第 4 个 元 素 的 值 都 打印 出 来 
printf("a[0] = %d，a[1] = %d，a[2] = %d, a[3] = %d\n", 
a[9]，a[1]，a[2]，a[3]) 


// 声明 一 个 含有 5 个 类 型 为 float 的 元 素 的 数组 对 象 f， 
// 对 其 第 二 个 元 素 初 始 化 为 10 .5f， 第 4 个 元 素 初 始 化 为 -0 .5f， 其 余 元 素 均 为 0 .0f 
float f[5] = { [1] = 10.5f, [3] = -0.5f }; 


// 将 数组 f 的 第 1 到 第 5 个 元 素 的 值 都 打印 出 来 
printf("f[0] = %f, f[1] = %f, f[2] = %f, f[3] = %f, f[4] = %f\n", 
f[0], FELTs f[2], f[3]， f[4]); 























































































































// 声明 一 个 含有 3 个 类 型 为 int32 七 的 元 素 的 数组 b， 

// 然后 用 之 前 的 c[6]，a[9]，f[1] 对 其 初始 化 。 

// 这 里 在 声明 数组 b 的 时 候 不 指明 其 大 小 ， 

// 此 时 将 通过 初始 化 列表 中 元 素 的 个 数 来 确定 其 元 素 个 数 




















int32_t b[] ={fc[9]，a[6]，f[1] }; 


// 这 里 仅 声明 了 一 个 含有 3 个 类 型 为 int32 七 的 元 素 的 数组 d， 
// 但 数组 d 的 每 个 元 素 都 没有 被 初始 化 ， 如果 没 有 初始 化 列表 ， 那 么 必须 指定 数组 元 素 个 数 
Int32 t d[3]; 


// 分 别 为 数组 d 的 三 个 元 素 赋值 

d[9] = b[2]; // 将 数组 b 的 第 3 个 元 素 赋 值 给 数组 d 的 第 1 个 元 素 
d[1] = b[1]， // 将 数组 b 的 第 2 个 元 素 赋值 给 数组 d 的 第 2 个 元 素 
d[2] = b[9]; // 将 数组 b 的 第 1 个 元 素 赋值 给 数组 d 的 第 3 个 元 素 


// 将 数组 d 的 三 个 元 素 的 值 分 别 打印 出 来 
printf("d[9] = %d, 中 和 = %d，d[2] = %d\n", 
d[9], d[1], d[2]); 


// 这 里 声明 ] 含有 8 个 int16_t 类 型 元 素 的 数组 s， 并 对 它 进 行 初 始 化 ， 

// 使 用 了 有 化 器 的 混合 方式 ， 

// 此 时 确定 数组 对 象 元 素 个 数 的 方式 为 : 判定 初始 化 列表 中 指定 下 标的 最 大 索引 值 ; 
// 然后 将 此 最 大 下 标 索引 值 加 1 就 是 该 数组 对 象 元 素 的 个 数 ， 

// 这 里 ， 指 定 下 标 初始 化 器 的 下 标 最 大 索引 值 为 6， 所 以 一 7 个 元 素 。 
// 其 中 第 1 个 元 素 为 -1; 第 2 个 元 素 为 2， 第 3 个 元 素 为 0; 2 i 抑 科 为 19， 
// 第 5 个 元 素 为 1; 第 6 个 元 素 为 20; 第 7 个 元 素 为 5。 

// 当 指 定 下 标 初 始 化 器 之 后 出 现 一 个 顺序 下 标 初 始 化 器 时 ， 
// 此 顺序 下 标的 索引 值 为 前 一 个 指定 下 标的 索引 值 加 1， 所 以 这 里 最 后 一 个 值 为 20 的 元 素 的 下 标 索引 为 5 
int16 t s[] ={ -1, 2, [3] = 10，[6] = 5, [4] = 1, 20 }; 


// 将 数组 s 的 各 个 元 素 的 值 都 分 别 打印 出 来 
printf("s[0] = %d, s[1] = %d, s[2] = %d, s[3] = %d\n", 
s[0], s[1], s[2], s[3]); 
printf("s[4] = %d, s[5] = %d, s[6] = %d\n", 
s[4], s[5], s[6]); 

























































































































































































struct T 


int32 t a, b; 

















声明 了 一 个 含有 4 个 元 素 的 struct T 结 构 体 类 型 的 元 素 的 数组 

声明 包含 了 各 种 有 效 的 结构 体 对 象 元 素 初始 化 器 与 数组 初始 化 器 进行 有 效 混用 的 方式 。 

// 其 中 第 一 个 元 素 的 初始 化 器 展示 了 可 完全 将 其 各 个 成 员 的 值 按 次 序 摆 在 数组 初始 化 列表 中 ; 

// 第 二 个 元 素 的 初始 化 器 则 是 使 用 了 更 直观 的 { } 来 初始 化 其 结构 体 成 员 ; 
第 三 个 元 素 是 用 了 指定 下 标的 数组 初始 化 器 结合 指定 成 员 的 结构 体 初始 化 器 ; 

// 第 四 个 元 素 则 是 分 别 对 其 结构 体 成 员 进行 初始 化 

/** 数组 对 象 t 的 内 容 如 下 所 示 (由 Xcode 调试 器 展示 出 〉: 






































































































































(T [4]) t= 

[0] = (a = 10, b = 20) 
[1] = (a = 1, b = 2) 
[2] = (a = -1, b = -2) 
[3] = (a = 4, b = 5) 


} 


4 
i Re Ws es 2}, [2] = {.a= -1, .b = -2}, 
[3].a = 4, [3].b = 5 }; 


代码 清单 7-1 详 细 描 述 了 数组 对 象 的 声明 、 初 始 化 以 及 元 素 访问 。 
为 了 直观 ， 后 面 我 们 统一 将 a[0] 精 简 地 描述 为 数组 对 象 a 的 0 号 元 素 ， 这 
也 表示 数组 a 的 第 一 个 元 素 ， 这 样 表 述 更 为 下 观 ， 且 不 会 引起 概念 上 的 
紊乱 ， 而 且 也 比 “ 下 标 索 引 为 0 的 元 素 ” 的 表达 要 更 为 精简 。 





一 个 一 维 数组 对 象 ， 比 如 int a[10]; 其 类 型 为 int[10]， 表 示 含 有 10 个 
int 类 型 对 象 的 数组 类 型 ， 对 象 a 的 类 型 类 别 为 数组 。 一 个 数组 对 象 中 的 
元 素 通常 是 按照 从 低地 址 到 高 地 址 的 顺序 来 存放 的 。0 号 元 素 放 在 数组 
对 象 的 起 始 地 址 ，1 号 元 素 放 在 数组 对 象 的 起 始 地 址 加 上 数组 元 素 类 型 
的 长 度 所 得 的 地 址 处 。 当 一 维 数 组 对 象 作 为 sizeof 的 操作 数 时 ，sizeof 操 
作 符 所 返回 的 结果 为 该 数组 元 素 个 数 乘 以 该 数组 元 素 类 型 的 长 度 。 比 
如 ， 上 述 的 数组 对 象 a，sizeof (Ca) 的 结果 就 相当 于 10*sizeof (int) ， 

在 32 位 或 64 位 系统 下 ， 结 果 就 是 40。 也 就 是 说 ， 数 组 对 象 a 所 占 的 存储 
空间 为 40 个 字 节 。 图 7-1 展 示 J 了 intb[3]={1，2，3} 的 存储 空间 布局 《在 
Apple LLVM 8.0，macOS 10.12 系 统 下 运行 得 出 ) 。 
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图 7-1 一 维 数组 对 象 b 的 某 个 存储 布局 








图 7-1 展 示 了 上 述 数 组 对 象 b 在 macOS 10.12 下 运行 时 的 存储 布局 。 
这 里 说 明 一 下 ， 数 组 b 对 象 自身 所 在 的 地 址 为 0x7fff5fbff80c， 其 0 号 元 素 
1 所 在 地 址 就 是 0x7fff5fbff80c， 其 1 号 元 素 2 所 在 地 址 为 0x7fff5fbff810， 
其 2 号 元 素 3 所 在 地 址 为 0x7fff5fbff814。 数 组 对 象 b 的 总 大 小 为 12 个 字 


二 





数组 类 别 的 对 象 与 其 他 对 象 不 同 ， 不 能 将 一 个 数组 对 象 直 接 赋 值 给 

另 一 个 数组 对 象 ， 即 便 对 一 个 数组 对 象 进 行 初 始 化 时 也 同样 如 此 ， 但 这 

里 有 一 个 例外 就 是 匿名 数组 对 象 〈 即 数组 的 复合 字面 量 ) 可 以 在 对 茶 个 

数组 对 象 初始 化 时 直接 赋值 给 它 。 要 把 一 个 数组 对 象 中 的 某 些 元 素 赋 值 

给 为 一 个 数组 对 象 的 茶 些 元 素 时 ， 通 常 使 用 单个 元 素 赋值 的 方式 ， 或 是 

通过 <string.h> 中 声明 的 库 函 数 memcpy 做 字 节 拷贝 。 代 码 清单 7-2 展 示 了 
匿名 数组 的 形式 以 及 给 数组 元 素 赋 值 的 方式 。 





代码 清单 7-2 匿名 数组 的 形式 以 及 给 数组 元 系 赋值 的 方式 





#include <stdio.h> 
#include <string.h> 


int main(int argc, const char * argv[]) 
































// 这 里 声明 了 数组 对 象 a， 其 类 型 为 int[3]， 并 直接 用 初始 化 列表 对 它 初始 化 
int a[] = { 1, 2, 3 }; 


// 输出 数组 对 象 a 的 大 小 


printf("a size is: %zu\n", sizeof(a)); 


// 这 里 声明 了 数组 对 象 b， 其 类 型 为 Int[3] ， 并 用 一 个 匿名 数组 对 象 对 它 初始 化 ， 
// 该 匿名 数组 对 象 的 类 型 也 是 int [3]。 
// 这 里 倘若 使 用 int b[] = a; 这 种 方式 对 b 进 行 初始 化 ， 则 会 引发 编译 错误 
int b[] = (int[]){ 4, 5, 6 }; 


// 输出 数组 对 象 b 的 元 素 个 数 
// 这 里 我 们 通 ; 和 占用 多 少 字 节 来 获得 其 元 素 个 数 
printf("b elments count: %zu\n", sizeof(b) / sizeof(b[0])); 





















































































































































// 在 使 | 村 名 数组 给 一 个 数组 对 象 进行 初始 化 时 ， 类 型 必须 匹配 。 

// 这 里 一 维 数组 对 象 c 与 匿名 数组 对 象 的 类 型 均 为 nt [10]。 

// 如 果 这 里 匿名 数组 的 元 素 个 数 不 是 10， 则 会 引发 编译 报错 。 

// 这 里 ， 匿 名 数组 对 象 一 共 含 有 10 个 Int 类 型 对 象 ， 

// 其 中 0 号 元 素 值 为 1; 2 号 元 素 值 值 为 -1; ST 2， 其 余 元 素 值 均 为 6 
int c[10] = (int[10]){ [0] = 1, [2] = -1, -2 }; 


// 声明 一 个 数组 对 象 d， 其 类 型 为 int[20]， 表 示 含 有 20 个 Int 对象 元 素 的 一 维 数组 
// 人 台 化 ， 其 每 个 元 素 的 值 都 是 不 确定 的 
int d[20]; 





































































































































































































// 我 们 用 库 函 数 memcpy 先 对 数组 对 象 d 的 前 16 个 元 素 进行 赋值 。 
// 这 里 使 用 数组 对 象 c 的 所 有 元 素 拷 贝 到 数组 d 的 前 16 个 元 素 中 
// memcpy 的 第 一 个 参数 为 要 拷贝 的 目的 数据 地 址 ， 第 二 个 参数 为 源 数据 地 址 ; 
// 第 三 个 参数 表示 要 拷贝 的 总 字 节 数 

memcpy(d， c, Sizeof(c) ) ; 


// 随后 我 们 分 别 对 数组 对 象 d 的 12、14、16 号 元 素 进 行 赋值 




























































































d[12] = b[9]; 
d[14] = a[9]; 
d[16] = a[1i] + b[1]; 














| 
- 





// 最 后 ， 我 们 用 匿名 数组 对 象 对 数组 d 的 17 到 19 号 元 素 进行 赋值 。 
// 由 于 这 里 的 memcpy 是 一 个 宏 ， ae 

// 因此 ， 这 里 在 匿名 数组 对 象 外 / 个 圆 括号 来 避免 宏 内 部 处 理 所 引 发 的 问题 ， 
// 一 般 情 况 下 ， 最 外 层 的 六 括 入 是 末 省 二 

memcpy(&d[17], ((int[]){7, 9, 8}), 3 * sizeof(int)); 





































































































代码 清单 7-2 详 细 介 绍 了 匿名 一 维 数组 对 象 的 使 用 方法 以 及 数组 的 

初始 化 与 赋值 的 约束 。 这 里 大 家 要 注意 的 是 ， 使 用 库 函 ee 
必须 先 引 入 头 文 件 <string.h>。 在 语句 块 作用 域 声 明 的 一 个 数组 对 象 ， 
未 经 初始 化 ， 那 么 其 每 个 元 系 的 值 都 是 不 确定 的 。 如 果 访 问 一 个 数组 对 
象 的 下 标 索 引 超 出 了 数组 对 象 本 吴 的 大 小 ， 则 可 能 引发 程序 异常 。 比 如 
在 代码 清单 7-2 中 ， 如 果 有 像 “a[3]=4; ”这 样 的 赋值 语句 ， 那 么 在 执行 这 
条 语句 时 就 可 能 引发 程序 崩 尝 ， 由 于 数组 a 一 共 只 有 3 个 元 素 ， 有 效 下 标 
索引 值 从 0 一 2， 而 下 标 索 引 值 3 超出 了 这 个 范围 ， 所 以 此 时 对 a[3] 进 行 访 
问 就 发 生 了 数组 访问 越界 问题 。 














7.2 多维 数 组 


7.1 节 我 们 介绍 了 一 维 数组 对 象 以 及 数组 对 象 的 各 种 特性 ， 包 括 如 
何 初始 化 、 如 何 为 其 元 素 赋 值 等 。 本 节 我 们 将 介绍 多 维 数组 。 多 维 数组 
在 科学 计算 上 用 得 尤为 多 ， 比 如 ， 如 果 一 个 一 维 数组 能 表示 一 个 癌 量 的 
话 ， 那 么 二 维 数组 就 能 用 来 表示 一 个 MxN 的 甜 阵 ， 而 更 多 维 的 数组 则 能 
表示 更 多 维度 的 数据 。 











形式 如 int a[2][3]， 表 示 声 明了 一 个 二 维 数组 对 象 a， 其 类 型 为 int[2] 
[3]， 表 示 含 有 2 个 int[3] 类 型 的 数组 。 习 惯 上 ， 我 们 很 多 时 候 也 会 将 其 描 
述 为 具有 2 行 3 列 的 int 类 型 元 素 的 数组 。 不 过 无 论 怎么 描述 ， 有 一 点 必须 
清楚 ， 那 就 是 数组 对 象 a 的 每 个 元 素 都 是 int[3] 类 型 。a[0] 表 示 数 组 a 的 0 
号 元 素 ， 它 是 一 个 具有 3 个 int 元 素 的 数组 ;a[0][0] 表 示 数 组 a 的 0 号 元 素 
《 即 一 个 int[3] 类 型 数组 ) 中 的 0 号 元 素 。a[1][2] 则 表示 数组 a 的 1 号 元 素 
中 的 2 号 元 素 。 











二 维 数组 的 初始 化 与 元 素 访 问 如 代码 清单 7-3 所 示 。 


代码 清单 7-3 ”二 维 数组 的 初始 化 与 元 素 访问 





#include <stdio.h> 
#include <string.h> 


int main(int argc, const char * argv[]) 


// 声明 了 一 个 二 维 数组 对 象 a， 其 类 型 为 int [2][3]， 
// 表示 具有 2 个 int[3] 类 型 的 元 素 的 数组 ， 然 后 用 数组 初始 化 列表 进行 初始 化 






























































int a[2][3] = { 
// 对 数组 a 的 9 号 元 素 进行 初始 化 
// 数组 a 的 0 号 元 素 是 一 个 int[3] 数 组 ， 其 每 个 元 素 初 始 化 完 之 后 
// 分 别 为 : 1，2，3 
{1, 2, 3}, 


// 对 数组 a 的 1 号 元 素 进行 初始 化 . 

// 数组 a 的 1 号 元 素 是 一 个 nt[3] 数 组 ， 其 每 个 元 素 初始 化 完 之 后 
// 分 别 为 : 4，5，6 

{4,5, 6} 





















































}; 


// 这 里 分 别 打 印 数组 a 的 9 号 元 素 中 的 1 号 元 素 ， 
// 以 及 数组 a 的 1 号 元 素 中 的 2 号 元 素 
printf("a[0][1] = %d, a[1i][2] = %d\n", 
a[o][1], a[1][2]); 
// 输出 数组 对 象 a 的 大 小 
// 数组 对 象 a 的 大 小 为 2 * 3 * sizeof(int)， 一 共 24 个 字 节 
printf("size of a is: %zu\n”, sizeof(a)); 
// 对 个 二 维 数组 的 初始 化 也 能 扁平 化 为 像 对 一 个 一 维 数组 那样 进行 初始 化 。 
// 这 里 数组 b 的 每 个 元 素 的 值 与 数组 得 a 中 的 完全 一 致 ， 
// 所 以 ， 这 里 的 初始 化 列表 与 上 述 a 的 初始 化 列表 是 等 效 的 
int b[2][3] = { 
1, 2, 3, 4, 5, 6 
}; 


// 输出 bp[9] 的 大 小 ,由 于 b[9] 为 int[3] 类 型 ， 所 以 大 小 为 3 * 4 = 12 字 节 
printf("size of b[0] is: %zu\n", sizeof(b[0])); 


// 在 声明 一 个 二 维 数组 对 象 时 ， 倘 若 直 接 对 它 初始 化 ， 

// 那么 其 元 素 个 数 可 以 不 指明 ， i 
// 这 里 ， 数 组 对 象 c 的 每 个 元 素 为 int[3] 类 型 ， 这 里 的 3 不 能 缺 省 。 
// 最 终 c 的 类 型 为 int[4] [3] 

int c[][3] = { 










































































































































































































































































// 对 其 9 号 元 素 进行 初始 化 
[0] = { 1，2，3 }， 
[2] = { 4, 5 }, // 1 号 元 素 的 数组 元 素 均 为 0，c[2][2] 也 为 6 





























// 这 里 使 用 指定 元 素 的 初始 化 器 
[3][6] = b[1][2]，[3][2] = 7 // c[3][4] 的 值 为 6 














printf("c[o][0] = %d, c[1][1] = %d, c[2][2] = %d，c[3][6] = %d\n", 
c[69j[6]，c[1][I1]，c[2][2]，c[3][9])， 
// 如 果 在 语句 块 作用 域 中 声明 一 个 二 维 数组 ， 但 没有 对 它 直接 初始 化 ， 


// 那么 必须 指明 该 数组 对 象 的 元 素 个 数 ， 因 此 这 里 的 2 不 能 省 
int d[2][3]; 


// 将 数组 b 的 元 素 找 贝 到 数组 d 对 象 中 
memcpy(d, b, sizeof(d)); 







































































// 这 里 修改 d[1] [2] 的 值 
d[1][2] = c[3][2]; 


printf("d[9j[9] = %d, d[1][2] = %d\n", d[90][0], d[1][2]); 
// 声明 了 一 个 二 维 数 组 对 象 6e， 并 用 一 个 匿名 二 维 数 组 对 象 对 齐 初始 化 


// e 的 类 型 为 nt [3][4] 
int e[][4] = (int[][4]){ 
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类 2, 3 }, 
[1] = { 4, 5, 6 }, 
{7, 8, 9}, // 初始 化 列表 的 来 尾 允 许 添 加 一 个 额外 的 逗号 





】 


printf("e[0][0] = %d, e[1][1] = %d, e[2][2] = %d\n", 
e[9j[6]，e[1][1]，e[2][2])， 





代码 清单 7-3 展 示 了 二 维 数组 的 多 种 初始 化 方式 ， 包 括 直 接 使 用 初 
始 化 列表 以 及 使 用 匿名 二 维 数组 对 象 ， 另外 ， 也 介绍 了 二 维 数组 初始 化 
列表 中 的 指定 元 素 下 标的 初始 化 右 以 及 顺序 下 标的 初始 化 圳 : 随后 ， 又 
介绍 了 二 维 数 组 元 系 的 找 贝 以 及 对 单个 元 素 的 访问 方式 。 


二 维 数 组 的 元 素 存储 方式 与 一 维 数组 类 似 。 由 低地 址 到 高 地 址 ， 先 
存放 0 号 元 素 中 的 所 有 元 素数 据 ， 然 后 再 存放 1 号 元 素 中 的 所 有 元 么 数 
据 ， 以 此 类 推 。 图 7-2 展 示 了 代码 清单 7-3 中 二 维 数组 对 象 的 元 素 和 存储 布 
局 。 











上 妇 | < | 国 CDemo ) 类 Ox7fff5fbif800 
7FFF5FBFF800 01 00 00 00 02 00 00 00 03 00 00 00 04 00 00 00 05 00 00 00 06 00 00 00 


图 7-2 ”二 维 数组 对 象 a 的 元 素 存储 布局 








图 7-2 中 ， 二 维 数组 对 象 a 的 首 地 址 为 0x7fff5fbff800， 其 0 号 元 素 为 
一 个 int[3] 类 型 的 数组 ， 这 个 数组 中 的 元 素数 据 先 存放 在 与 a 相 同 的 首 地 
址 处 ， 然 后 每 个 元 素 依次 存放 在 0x7fff5fbff800、0x7fff5fbff804、 
0x7fff5fbff808 处 ;二 维 数组 对 象 a 的 1 号 元 素 也 是 一 个 int[3] 类 型 的 数组 ， 
它 存放 在 0x7fff5fbff80c 处 ， 并 且 其 每 个 元 素 依 次 存放 在 地 址 
0x7fff5fbff80c、0x7fff5fbff810、0Ox7fff5fbff814 处 。 整 个 数组 对 象 a 所 占 


存储 空间 为 24 个 字 节 。 











除了 二 维 数组 ， 我 们 还 可 以 声明 三 维 、 四 维 ， 甚 至 更 高 维度 的 数 








组 ， 至 于 最 多 能 支持 多 少 维 数组 是 由 C 语 言 实现 自己 定义 的 ， 不 过 一 般 
支持 到 十 维 数组 问题 都 不 大 。 多 维 数组 的 构造 形式 与 二 维 数 组 类 似 。 比 
如 ，int a[2][3][4]， 声 明了 一 个 三 维 数组 对 象 a，a 的 类 型 为 int[2][3][4]， 
a[0] 的 类 型 为 int[3][4]，a[0][0] 的 类 型 为 int[4]。 这 也 就 是 说 ， 三 维 数组 对 
象 a 中 含有 两 个 元 素 ， 且 每 个 元 素 都 是 一 个 int[3][4] 的 二 维 数组 对 象 。 四 
维 数组 也 类 似 ， 比 如 intb[2][3][4][5]， 声明 了 一 个 四 维 数组 对 象 p， 其 类 
型 为 int[2][3][4][5]， 共 有 两 个 元 素 ， 每 个 元 素 为 类 型 是 int[3][4][5] 的 三 
维 数组 对 象 。 三 维 、 四 维 数组 的 元 素 存储 布局 也 与 二 维 数组 的 类 似 ， 都 

是 按照 从 低地 址 到 高 地 址 依次 存放 每 个 元 素 的 数据 内 容 的 。 代 码 清单 7- 
4 描述 了 三 维 数组 的 一 些 基本 操作 。 


























代码 清单 7-4 三 维 数组 的 一 些 基本 操作 





#include <stdio.h> 
#include <string.h> 


int main(int argc, const char * argv[]) 
// 声明 一 个 三 维 数组 对 象 4， 其 类 型 为 nt [2] [3] [4] 


// 其 每 个 元 素 的 类 型 为 int [3] [4] 
int al21[3][41 = = { 
0 号 元 素 























元 
人 
{ 1, 2, 3, 4 3, 
{ 5, 6, 7,8}, 有 
{ 9，10，11，12 }， // 这 里 可 添加 一 个 额外 的 逗号 
}, 
// 1 号 元 素 
{ -1, -2, -3, -4 }, 
{-5, “Dr =7; -=8 }, 
{ -9, -10, -11, -12 } 
}， // 这 里 的 添加 一 个 额外 的 逗号 

















}; 
printf("a[9][9][6] = %d，a[1][1][1] = %d\n", 
a[6][6][9]，a[1][1][1])， 


// 声明 一 个 三 维 数组 对 象 b， 其 类 型 为 int[2][3] 人 
// 这 里 可 以 用 与 一 维 数组 初始 化 列表 相同 的 方式 为 其 初 












































// 三 维 数 组 的 元 素 个 数 可 省 ， 这 样 根据 初始 化 列表 来 确定 其 元 素 个 数 ， 
// 但 其 每 个 元 素 的 类 型 必须 指明 ， 所 以 这 里 的 [3][4] 中 的 任何 值 都 不 能 缺 省 
int DET3j[4] = = 

0 号 元 素 





















































2，3，4， 

5, 6, 7, 8, 

9, 10, 11, 12, 

// 1 号 元 素 

= 2 95 
-5, -6, -7, -8, 
-9, -10, -11, -12 


}; 


// 此 时 ， 数 组 b 的 元 素 内 容 与 数组 a 的 完全 相同 
printf("b[9][1][1] = %d, b[1][2][2] = %d\n", 
b[9][1][1]，b[1][2][2])， 


// b 的 大 小 为 2 * 3 * 4 * sizeof(int) = 96， 即 占 
printf("b size is: %zu\n", sizeof(b)); 


// 三 维 数组 对 象 的 初始 化 列表 也 能 使 用 指定 元 素 索 引 的 初始 化 器 
// 这 里 未 受 指定 的 元 素 的 值 都 将 被 初始 化 为 9 
int c[3][2][4] = { 
// 初始 化 9 号 元 素 
[0] = ew { {1, 2, 3, 4}, {5, 6, 7, 8} } 
// 初始 化 1 号 元 未 
[1] ={ [0] = { -1, -2, -3, -4 }, [1][2] = -5, -6 }, 
// 分 别 指定 2 号 元 素 中 的 若 元 素 进行 初始 化 
[2][0] = { 10, 11, 12, 13 }, [2][1][1] = 14, 15 














96 个 字 节 的 存储 空间 
















































































}; 


printf("c[1][1][0] = %d，c[1][1][3] = %d, c[2][1][2] = %d\n", 
c[1][1i][90], c[1][1][3], cL[2][1][2]); 


// 声明 一 个 二 维 数组 对 象 d， 且 不 对 它 进行 直接 初始 化 
int d[3][4]; 


// 将 a[1] 中 二 维 数 组 对 象 的 元 素 内 容 找 贝 到 二 维 数 组 对 象 d 中 
memcpy(d, a[1], sizeof(d)); 























printf("d[o][0] = %d，d[1][1] = %d, d[2][2] = %d\n", 
d[6j[6]，d[1][1]，d[2][2])， 





代码 清单 7-4 展 示 了 三 维 数组 的 声明 、 初 始 化 以 及 对 其 元 系 的 访 
问 。 通 过 以 上 这 些 例 子 各 位 应 该 能 很 容易 地 总 结 出 来 : 二 维 数 组 的 每 个 
元 素 是 一 个 一 维 数组 对 象 ， 三 维 数 组 的 每 个 元 素 是 一 个 二 维 数组 对 象 ， 
么 N 维 数组 的 每 个 元 素 则 是 一 个 N-1 维 数组 对 象 。 





7.3 ” 变 上 长 数组 





我 们 在 7.1 节 与 7.2 节 中 描述 的 数组 都 是 固定 长 度 的 数组 。C99 标 准 引 
入 了 一 种 叫 可 变 长 度 的 数组 〈variable length array) ， 这 类 数组 在 声明 
时 ， 其 元 素 个 数 不 是 用 常量 表达 式 来 指定 的 ， 而 是 通过 变量 。 因 此 变 长 
数组 不 能 在 文件 作用 域 中 声明 ， 不 能 用 static 存 储 类 说 明 符 来 修饰 。 此 
外 ， 变 长 数组 以 及 指向 变 长 数组 的 指针 类 型 统称 为 可 变 修改 类 型 
Cvariably modified type) 。 当 可 变 修改 类 型 作为 sizeof 的 操作 数 时 ， 
sizeof 操 作 符 的 结果 将 在 运行 时 计算 ， 并 且 操 作 数 所 产生 的 副作用 也 将 
会 体现 出 来 。 随 后 ， 变 长 数组 声明 之 后 不 能 直接 对 它 进 行 初始 化 ， 我 们 
只 能 通过 memcpy 等 库 函 数 或 通过 直接 访问 其 元 素 的 方式 对 该 数组 中 的 
指定 元 素 进行 赋值 。 正 由 于 变 长 数组 不 能 直接 使 用 初始 化 器 进行 初始 化 
列表 ， 所 以 不 存在 匿名 变 长 数组 对 象 ， 即 变 长 数组 的 复合 字面 量 。 








变 长 数组 在 有 些 场合 还 是 比较 实用 的 。 比 如 说 ， 我 们 要 在 一 个 函数 
内 部 定义 一 个 数组 ， 但 其 大 小 需要 通过 函数 参数 来 指定 ， 且 元 素 个 数 也 
不 会 太 多 。 此 时 ， 如 果 随 便 定义 一 个 比较 大 的 数组 也 会 造成 栈 空间 的 不 
必要 的 浪费 ， 而 使 用 变 长 数组 则 正好 能 满足 需求 。 


代码 清单 7-5 描 述 了 变 长 数组 的 一 些 使 用 方式 以 及 特性 。 


代码 清单 7-5 ” 变 长 数组 





#include <stdio.h> 


int main(int argc, const char * argv[]) 


{ 


int a = 5; 


// 声明 了 一 个 含有 a 个 元 素 的 变 长 数组 对 象 bp， 类 型 为 nt [a]， 
// 这 里 不 能 对 数组 对 象 b 直 接 做 初始 化 
int bl[lal; 


// 我 们 这 里 先 将 a 做 增 1 操作 ， 此 时 a 变 为 6 


at+， 


// 观察 数组 b 的 大 小 ， 这 里 sizeof(b) 就 可 能 不 是 在 编译 时 得 出 的 ， 而 是 在 运行 时 计算 得 到 。 
// 尽管 变量 a 增 加 了 1， 但 此 时 b 的 大 小 仍 为 20 个 字 节 ， 说 明 一 共 含 有 5 个 int 类 型 的 元 素 。 
// 说 明 数 组 b 的 大 小 在 声明 的 时 候 就 已 经 确定 而 不 变 了 


printf("b size is: %zu\n", sizeof(b)); 

























































































int x = 0; 


// em ae dt 针 p，p 是 一 个 可 变 修改 类 型 的 指针 对 象 。 

// 指针 p 指 向 数组 b 的 地 址 。 这 意 的 是 

// 于 8 的 值 已 经 被 修改 过 了 ， 增加 到 6) ， 

// 所 以 ， 这 里 (*p ) 的 类 型 虽然 仍然 为 int [al]， 但 int[a] 显 然 具 有 6 个 int 类 型 的 元 素 
int (*p)[a]l = &b; 


// 这 里 ，(*p ) 的 大 小 为 int[a] 的 大 小 ， 计 算得 到 24 个 字 节 
printf("p[0] size is: %zu\n", sizeof(p[++x])); 


// 这 里 ，x 的 值 为 1， 说 明 sizeof 操 作 数 中 产生 了 ++x 的 副作用 
// 这 里 sizeof 的 计算 是 在 运行 时 得 到 结果 的 ， 而 不 是 在 编译 时 
printf("x = %d\n", x); 


// 如 果 在 变量 前 十 加 了 一 个 const 修 饰 ， 则 说 明 它 是 一 个 常量 
const int n = 10; 


// 这 里 一 维 数 组 对 象 d 就 不 是 一 个 变 长 数组 ， 而 是 一 个 定 长 数组 
// 尽管 这 里 数组 元 素 个 数 用 n 来 指定 ， 不 过 d 的 类 型 可 以 看 作为 int[19] ， 而 不 是 int[n] 
int d[n] = { 1, 2, 3 }; 


// 这 里 用 常量 n 定 义 了 J 
过 ， 这 里 的 q 不 是 一 个 可 变 修改 类 型 (*q) 的 类 型 为 nt [10] 
int (*q)[n] = &d; 


// 这 里 的 ++X 不 产生 任何 副作用 ， 因 为 (*q) 不 是 一 个 变 长 数组 类 型 
printf("q[0] size is: %zu\n", sizeof(q[++x])); 


// x 的 值 仍然 为 1 
printf("x = %d\n", x); 


» 大 家 要 注意 的 是 ， 只 有 当 sizeof 操 作 数 类 型 为 可 变 修改 类 型 时 ， 计 算 才 会 在 运行 时 执行 ， 
否则 的 话 ， 仍然 在 编译 时 就 能 获得 结果 ， 且 不 会 产生 副作用 。 

比如 这 里 ， 尽管 b 是 一 个 变 长 数组 类 型 int [a] ， 但 bp[++X] 的 类 型 为 int， 

// 不 是 一 个 宁 变 修改 类 型， 所 以 这 里 的 sizeof 仍 然 在 编译 时 得 到 结果 ， 且 ++x 不 产生 副作用 


printf("b[0] size is: %zu\n", sizeof(b[++x])); 


// x 的 值 仍然 为 
printf("x = %d\n", x); 
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代码 清单 7-5 展 示 了 变 长 数组 的 一 些 基本 特性 ， 同 时 还 涉及 了 本 








稍 后 将 会 介绍 的 指针 相关 的 话题 。 为 了 说 明 可 变 修改 类 型 作为 sizeof 操 
作 数 时 的 运行 时 特性 ， 以 及 操作 数 产 生 的 副作用 的 特性 ， 所 以 这 里 先 借 
用 一 下 。 此 外 ， 还 谈 到 了 用 const 限 定 符 来 修饰 对 象 的 情况 ， 此 时 该 对 象 


也 作为 一 个 常量 而 不 是 变量 。const 限 定 符 将 在 12.1 节 中 介绍 。 








7.4 一 级 指针 与 对 象 地 址 


从 本 车 开始 ， 我 们 将 正式 涉及 C 语 言 中 的 一 个 核心 概念 一 一 指针 
(pointer) 的 话题 。 在 前 面 一 些 章 节 中 ， 为 了 表达 C 语 言 的 茶 些 语法 特 
性 已 经 引 入 了 关于 指针 的 一 些 表 达 形 式 。 各 位 在 看 完整 个 第 7 章 后 ， 回 
头 去 看 那些 内 容 将 会 有 更 为 深刻 的 理解 。 现 在 市 面 上 有 不 少 高 级 语言 都 
宣称 扎 弃 了 “指针 ”这 个 概念 ， 但 实际 上 还 能 看 到 其 中 的 一 些 影子 。 比 如 
Java 中 ， 虽 说 没有 直接 引入 指针 语法 系统 ， 但 它 里 面 涉及 到 的 引用 
Creference) 本 质 上 仍然 是 一 个 指针 ， 只 不 过 Java 没 有 引入 直接 取 其 内 
容 或 取 茶 个 对 象 地 址 的 方式 ， 所 以 在 Java 中 你 也 无 法 取 一 个 引用 的 地 
址 。 而 在 C 语 言 中 ， 只 要 是 一 个 对 象 〈 对 象 都 拥有 目 己 的 存储 地 址 ) ， 
那么 就 能 取 其 地 址 。 

















7.4.1 地 址 与 指针 的 基本 概念 


要 解释 指针 这 个 概念 ， 我 们 先 说 地 址 〈address) 。 在 C 语 言 中 ， 无 
论 我 们 是 在 文件 作用 域 声明 一 个 对 象 ， 还 是 在 语句 块 作用 域 声明 一 个 对 
象 ， 它 们 都 具有 自己 的 地 址 。 比 如 ， 我 们 在 main 函 数 中 声明 了 一 个 对 
象 : inta=10;，， 那 么 对 象 a 就 有 它 目 己 的 地 址 。 我 们 通过 单 目 操作 符 & 
来 取 对 象 的 地 址 一 一 &a。 这 里 的 & 操 作 符 在 C 语 言 标 准 中 也 称 为 地 址 操 








作 符 〈address operators) ， 它 是 一 个 单 目 前 绥 操 作 符 ， 跟 在 它 后 面 的 表 
达 式 作为 其 操作 数 。 一 个 对 象 的 地 址 长 度 根据 不 同 的 系统 环境 会 有 所 不 
同 。 比 如 ， 通 常 在 32 位 处 理 器 系统 模式 下 ， 地 址 的 长 度 为 4 个 字 节 ; 在 
64 位 处 理 器 系统 模式 下 ， 地 址 的 长 度 为 8 个 字 节 。 一 个 地 址 表征 了 用 于 
存放 一 个 对 象 的 数据 内 容 的 位 置 。 当 然 ， 现 代 处 理 器 基本 都 有 一 套 内 存 
管理 系统 ， 所 以 我 们 在 应 用 程序 中 拿 到 的 都 是 虚拟 地 址 ， 而 在 一 些 简单 
的 符 入 式 系统 下 ， 如 果 没 有 引入 虚拟 地 址 特性 ， 那 么 获取 到 的 对 象 地 址 
就 是 物理 地 址 。 本 书 暂 时 不 考虑 对 象 所 在 的 是 虚拟 地 址 还 是 物理 地 址 ， 
我 们 将 它们 都 抽象 为 “地 址 ”。 





有 了 地 址 之 后 ， 我 们 如 何 把 对 象 的 地 址 保存 起 来 以 便 后 续 使 用 呢 ? 
这 个 时 候 ，C 语 言 束 引入 了 一 个 称 为 指针 的 类 型 类 别 。 一 个 指向 int 类 型 
对 象 的 指针 就 能 存放 int 类 型 对 象 的 地 址 。 我 们 在 声明 一 个 对 象 时 ， 在 对 
象 标识 符 前 添加 * 写 就 能 把 它 声明 为 一 个 指针 对 象 。 比 如 ， 要 声明 一 个 
指向 int 类 型 对 象 的 指针 对 象 p， 就 用 “int*p; ” 这 里 ，* 可 以 紧 贴 int 和 
p， 像 “int*p; ”这 也 完全 没 问题 。 不 过 在 习惯 上 ， 我 们 往往 会 将 * 与 对 象 
标识 符 紧 贴 ， 而 在 表示 一 个 类 型 时 ， 会 与 类 型 标识 符 紧 贴 。 比 
如 : “int*p; sizeof (int*) ; ”等 。 指 同一 个 普通 非 指针 对 象 的 指针 又 被 
称 为 一 级 指针 。 代 码 清单 7-6 描 述 了 一 级 指针 对 象 的 声明 、 初 始 化 以 及 
使 用 。 


代码 清单 7-6 一 级 指针 的 基本 使 用 


#include <stdio.h> 
int main(int argc, const char * argv[]) 


// 声明 了 一 个 int 类 型 对 象 a， 并 给 它 初始 化 为 19 
int a = 10; 


// 声明 了 一 个 指向 int 类 型 的 指针 对 象 p， 类 型 为 in 
// 并 用 对 象 a 的 地 址 对 它 初始 化 ， 此 时 ， 指 针 p 的 什 肚 是 对 象 8 的 地 址 。 
// 这 也 被 称 为 “指针 p 指 向 对 象 a” 


int *p = &a; 


// 一 个 指针 对 象 可 以 转 为 一 个 无 竺 呈 整 数 关 型 米 观 察 该 指 针对 象 的 值 。 

// 不 过 我 们 一 般 使 用 uintptr_t 类 型 来 表示 一 个 对 象 地 址 的 值 。 

// 这 里 其 实 就 是 输出 对 象 a 的 地 址 值 

printf("p Value is: QOx%.16tX, size is: %zu\n" 
(uintptr_t)p, sizeof(p)); 


















































代码 清单 7-6 简 单 明 了 地 阐述 了 如 何 声明 一 个 指针 对 象 并 为 它 进 
初始 化 的 方法 ， 最 后 还 输出 了 指针 对 象 p 的 值 。 以 上 代码 通过 Apple 
LLVM 8.0 编 译 并 在 macOS 10.12 系 统 下 运行 ， 由 于 是 64 位 系统 环境 ， 所 
以 地 址 长 度 为 8 个 字 节 。 图 7-3 展 示 了 对 象 a 与 指针 对 象 p 的 存储 布局 。 





曲 | < | 图 CDemo ) 羔 Ox7fff5fbff800 


图 7-3 ”对 象 a 与 指针 对 象 p 的 存储 布局 








图 7-3 所 展示 的 内 容 是 基于 代码 清单 7-6 的 运行 结果 。 最 后 打印 输出 
旨 针 对 象 p 的 值 〈“ 即 对 象 a 的 地 址 ) 为 0x00007FFF5FBFF80C， 并 且 对 象 a 
的 值 为 10。 在 图 7-3 上 我 们 能 看 到 ， 地 址 0x00007FFF5FBFF800 是 指针 对 
象 p 的 地 址 ， 而 它 的 内 容 正 是 0x00007FFF5FBFF80C (地 址 从 左 到 右 依次 
为 从 低地 址 到 高 地 址 ) ， 在 地 址 0x00007FFF5FBFF80C 处 的 内 容 为 0A 
000000《〈“ 用 十 六 进 制 表示 ) ， 即 十 进 制 数 10， 它 就 是 对 象 a 的 值 。 所 以 








通过 这 个 图 我 们 能 清晰 地 认识 到 ， 指 针对 象 本 身 也 有 它 自己 的 地 址 (这 
里 的 0x00007FFF5FBFF800 就 是 指针 对 象 p 的 地 址 ) ， 而 指针 对 象 的 值 就 
是 它 所 指向 的 那个 对 象 的 地 址 〈 这 里 p 的 值 就 是 它 所 指向 的 对 象 a 的 地 址 
0x00007FFF5FBFF80C) 。 


7.4.2 访问 指针 对 象 所 指 对 象 的 内 容 


当 一 个 指针 对 象 指 癌 了 某 一 对 象 之 后 ， 我 们 就 可 以 使 用 间接 操作 符 
(indirection operator) 通过 指针 对 象 间接 地 访问 它 所 指 癌 对 象 的 值 。 间 
接 操 作 符 也 是 *， 属 于 单 目 前 缀 操作 符 ， 跟 在 它 后 面 的 表达 式 作为 其 操 
作 数 。 它 与 用 来 声明 指针 类 别 对 象 的 * 不 属于 同 种 功能 。 间 接 操 作 符 只 
能 作用 于 指针 类 型 的 对 象 ， 也 就 是 说 间接 操作 符 的 操作 数 必须 是 一 个 指 
针 类 型 的 对 象 。 代 码 清单 7-7 简 单 介 绍 了 间接 操作 符 的 使 用 以 及 效果 。 





代码 清单 7-7 间接 操作 符 的 使 用 及 效果 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


// 声明 了 一 个 int 类 型 对 象 a， 并 给 它 初始 化 为 19 

int a = 10; 

// 声明 了 一 个 指向 Int 类 型 的 指针 对 象 p， 类 型 为 int*; 

// 并 用 对 象 a 的 地 址 对 它 初始 化 。 其 中 ，&a 表 达 式 的 类 型 也 是 int* 

int *p = &a; 
站 通过 间接 操作 符 对 指针 p 进 行 操作 ， 所 以 这 里 p 就 是 间接 操作 符 * 的 操作 数 ， 

// (*p) 的 类 型 为 int。 这 里 将 指针 p 所 指 的 内 容 修改 为 29 

*p = 20; 
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// 然后 我 们 可 以 观察 到 ， 对 象 a 的 值 变 为 了 20 
printf("a = %d\n", a); 
































// 声明 了 一 个 short 类 型 对 象 b， 并 用 p 所 指 的 对 象 的 值 对 它 进 行 初 始 化 
Short b = *p; 


printf("b = %d\n", b); 


运行 代码 清单 7-7 之 后 ， 我 们 就 能 神奇 地 发 现 ， 当 执行 
了 “*p=20; ”这 条 语句 之 后 ， 对 象 a 的 值 被 修改 为 0 了 。 这 是 怎么 发 生 的 
呢 ? 这 就 是 间接 操作 符 的 神奇 之 处 ! 我 们 可 以 借助 图 7-3 来 分 析 。 指 针 
对 象 p 所 在 地 址 为 0x00007FFF5FBFF800， 它 的 值 就 是 对 象 a 的 地 址 
0x00007FFF5FBFF80C。 而 当 对 指针 对 象 p 动 用 了 间接 操作 ， 所 访问 的 就 
是 以 指针 对 象 p 的 值 (0x00007FFF5FBFF80C) 作为 地 址 ， 然 后 获取 该 地 
址 中 的 内 容 。“*p=20; ”这 条 语句 其 实 做 了 两 步 操作 : 首先 获得 指针 对 
象 p 的 值 ， 然 后 以 这 个 值 作为 地 址 ， 把 20 写 入 到 这 个 地 址 中 去 。 这 样 地 
址 0x00007FFF5FBFF80C《〈 也 就 是 对 象 a 的 地 址 ) 的 内 容 由 原本 的 10 变 为 
了 20。 而 后 面 的 “short b=*p; ”也 是 同样 ， 先 获得 指针 p 的 值 ， 然 后 以 该 
值 作为 地 址 取 该 地 址 中 的 内 容 ， 将 该 数据 赋值 给 对 象 b。 








因此 ， 所 谓 的 间接 操作 其 实 就 是 以 操作 数 的 值 作为 地 址 ， 然 后 访问 
该 地 址 的 内 容 。 这 与 取 对 象 地 址 正好 是 一 个 逆 操 作 。 


7.4.3 ”指针 对 象 的 其 他 操作 





在 C 语 言 中 ， 两 个 指针 对 象 可 以 进行 大 小 比较 ， 也 就 是 比较 它们 所 
指向 对 象 的 地 址 大 小 ， 比 如 0x00007FFF5FBFF800 要 小 于 


0x00007FFF5FBFF80C， 所 以 代码 清单 7-6 中 的 指针 对 象 p 的 地 址 要 小 于 
对 象 a 的 地 址 。 而 指向 不 同类 型 的 指针 之 间 的 转换 通常 来 说 不 能 做 隐 式 
转换 。 我 们 在 第 5 章 讲解 整数 之 间 的 类 型 转换 时 谈 到 ， 在 C 语 言 中 高 精度 

与 低 精 度 整数 相互 转换 都 可 以 隐 式 执行 ， 不 需要 通过 投射 操作 显 式 给 

出 。 指 针 类 型 则 不 然 ， 一 个 int* 类 型 与 short* 类 型 之 间 就 无 法 进行 隐 式 转 
换 ， 必 须 通 过 投射 操作 进行 显 式 转换 ， 否 则 会 有 编译 警告 











本 节 一 开始 谈 到 了 对 象 的 地 址 。 一 个 对 象 在 C 语 言 中 通常 是 一 个 左 
值 (lvalue) ， 而 对 于 一 个 右 值 (Crvalue) 是 无 法 取 它 地 址 的 。C 语 言 标 
准 对 右 值 给 出 的 定义 是 : 一 个 表达 式 的 值 。 比 如 ， 一 个 sizeof 操 作 符 返 
回 的 值 、 一 个 整数 字面 量 、 对 一 个 对 象 做 取 地 址 操作 的 表达 式 ， 还 有 
++、-- 等 表达 式 。 不 过 当 以 上 这 些 表达 式 通 过 某 种 形式 套 上 了 间接 操作 
符 之 后 ， 就 又 能 使 用 & 进 行 取 地 址 操作 了 。 但 此 时 ，&& 取 地 址 操作 符 的 
语义 其 实 不 是 取 它 表达 式 的 地 址 ， 而 是 用 于 脱 去 间接 操作 的 效果 。 代 码 
清单 7-8 将 会 清楚 地 给 大 家 描述 以 上 这 些 内 容 的 实际 效果 。 





代码 清单 7-8 指针 与 取 地 址 的 其 他 特性 





#include <stdio.h> 
#include <stdbool.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// 声明 了 两 个 ijnt32_t 类 型 的 对 象 ， 分 别 为 a 和 b 
int32 t a = 10, b = 5; 


// 声明 了 三 个 指向 int32_t 类 型 的 指针 对 象 ， 分 别 为 p、q 和 r 

// 注意 ， 这 里 用 逗号 分 隔 的 声明 符 列表 中 ， 加 果 要 弟 明 是 指针 类 型 ， 
// 那么 每 个 指针 对 象 标识 符 前 都 必须 添加 * 。 

// 对 象 c 是 一 个 int32_ t 类 型 的 对 象 

int32 t *p = &a, *q = &b, c = 0, *r = &c,; 























// 指针 可 以 进 | 
bool e=p>dq'; 
printf("Is p > “gq? % 





e=p==r; 
py iT Chie p equal 


// 比较 r 是 否 与 对 象 e 的 
printf("Is r equal 


\ 以 及 判断 是 否 相 等 
d\n", e); 


to r? %d\n", 


也 址 相同 
to &c? %d\n", 


e); 





// 声明 了 一 个 int16_ t 类 型 


int16 t s = 1, 


句 会 出 现 


*t = 


// 以 下 这 
t = &a; 








&s; 











r == &c); 


J 对象 s 以 及 一 个 指向 int16_t 类 型 的 指针 对 象 t 


编译 警告 ， 因 为 jnt32_t* 类 型 与 nt16_t* 类 型 不 匹配 





// 以 下 这 名 也 会 出 现 警告 ， 因 为 int16_t* 类 型 与 int32_t* 类 型 不 匹配 














r = &S) 


// 如 果 要 用 指针 t 指 向 对 
= (int16_ t*)e&a; 





*t = 2048; // 通 








// 尽管 可 以 通过 





















































// 倘若 通 ; 过 指针 p 写 入 了 
p = (int32_t*)&s' 


十 投射 操作 将 和 
// 由 于 对 象 s 是 jnt16_t 类 型 ， 宽 度 没 
一 个 超出 int16_t 类 型 能 表示 范围 








象 a， 那 么 可 以 使 























// 这 里 不 会 
































针 t 将 对 象 a 的 值 


I 



































投 则 操作 来 做 类 型 4 强制 转换 


了 编译 警告 
间接 地 修改 为 2048 


间 针 p 指 向 对 象 S， 不 会 出 现 编 
有 p 所 指向 的 jnt32_t 类 型 的 宽度 大 ， 





译 警 告 ， 





但 不 建议 这 么 做 ! 
































1024; 





*p = 


// 这 里 不 会 有 任何 问题 ， 




















printf("a = %d, s = 


// 以 下 这 些 表达 式 都 是 
&b++; 


// 不 过 一 个 匿名 数组 、 匿 名 








%d\n", a, s); 


戎 误 的 ， 都 将 引发 编译 报错 
&++hb; &1234; &sizeof(b); &&a; 


结构 体 等 表达 式 可 以 进行 

















int32_t (*pa)[3] = &(int32_ t[]){1i, 2, 3}; 


struct S { int32_t 


a, b; 











因为 12024 在 ijnt16_t 类 型 可 表示 的 范 目 








的 值 ， 








dt 











内 





取 地 址 操作 


那 可 能 引发 无 法 预料 的 





由 | 


3 
政 


// pa 是 指向 一 个 匿名 数组 的 指针 





了 
struct S *ps = &(struct S){10，20}; // ps 是 指向 一 个 匿名 结构 体 的 指针 


// 以 下 表达 式 都 是 有 效 的 ， 并 且 


; &*++q; // 
p = &*r; // 
printf("*p = %d\n", 


a = 10; 





效果 如 同 与 : 
效果 如 后 与 : 
*p); 




















// 取 地 址 操作 符 与 间接 操作 符 允 许多 次 嵌 套 ， 尽 管 


b = *&*&*&a; // 
printf("b = %d\n", 


// 重新 让 指针 对 象 p 指 
p= &a; 





oh 





// 指针 与 整数 之 间 也 可 以 





这 人 句 等 同 于 : 
b); 
对 象 a 














过 投射 操作 来 相互 转换 。 





寸 区 











// 之 前 已 经 提 到 过 ， 用 
// 或 uintptr_t。 这 里 
ZY 这 里 通过 
uintptr_t address = 


个 指向 

































































// 这 里 声明 ] 





于 存放 指针 值 或 
address 的 值 就 是 指针 p 疼 
了 投 色 操作 将 措 向 int32、 t 类 型 的 指针 类 型 转换 为 uintptr_t 整 数 类 型 




















(uintptr_t)p; 





nt32_t 类 型 的 指针 对 象 p2， 











// 然后 直接 将 address 的 值 对 它 进行 初始 化 。 











区 地 址 与 间接 操作 相互 抵消 


这 看 上 去 比较 繁复 


也 址 值 最 佳 类 型 为 intptr_t， 
的 值 ， 即 对 象 a 的 地 址 值 。 


























// 这 里 通过 投射 操作 将 address 的 类 型 转换 为 一 个 指向 int32_t 的 指针 类 型 
Int32_ t *p2 = (int32_t*)address 




















printf("*p2 = %d\n", *p2); 





代码 清单 7-8 给 大 家 介绍 了 声明 指针 对 象 时 的 注意 事项 ， 其 中 大 家 
必须 要 注意 ， 指 针 说 明 符 * 一 般 是 紧 跟 对 象 标识 符 的 ， 而 不 是 类 型 名 。 
旨 针 之 间 可 以 比较 大 小 以 及 判别 是 否 相 等 。 取 地 址 操作 符 的 操作 数 一 般 
不 能 是 一 个 右 值 。 对 于 毗邻 的 间接 操作 符 与 取 地 址 符 ， 它 们 的 作用 将 会 
相互 抵消 。 一 个 指针 类 型 可 以 通过 投 财 操 作 而 转换 为 一 个 整 型 ， 同 样 ， 
一 个 整 型 也 可 以 通过 投 冉 操 作 转 换 为 一 个 指针 类 型 。 





以 上 这 些 就 是 关于 一 个 指针 对 象 的 基本 概念 和 作用 。 这 里 大 家 要 理 
解 ， 一 个 指针 对 象 本 身 也 是 个 对 象 ， 它 也 有 地 址 ， 而 它 的 值 则 是 它 所 指 
向 的 一 个 对 象 的 地 址 。 不 过 ， 我 们 可 以 通过 投射 操作 直接 给 一 个 指针 对 
象 赋值 为 一 个 具体 指定 的 地 址 值 ， 比 如 “int*p= (int*) 0x00FF0100; ”。 
这 里 ， 指 针对 象 p 就 指向 地 址 0x00FF0100。 当 然 ， 这 么 做 之 前 我 们 必须 
要 清楚 0x00FF0100 这 个 地 址 是 否 合法 ， 并 且 当 前 是 否 能 安全 地 访问 存放 
在 该 地 址 里 的 数据 内 容 。 














7.5 多 级 指针 


上 一 节 介 绍 了 一 个 一 级 指针 的 基本 概念 和 各 种 特性 ， 并 且 提 到 了 一 
个 指针 对 象 本 里 也 有 地 址 。 那 么 我 们 会 有 疑问 ， 我 们 应 该 如 何 用 一 个 指 
针对 象 去 指向 另 一 个 指针 对 象 的 地 址 呢 ? 此 时 ， 我 们 将 引入 多 级 指针 这 
一 概念 。 








如 果 我 们 要 指向 一 个 一 级 指针 对 象 的 地 址 ， 比 如 : “inttp; ”。 此 时 
如 果 要 指向 p 的 地 址 一 一 &p， 那 么 我 们 就 需要 一 个 二 级 指针 对 象 ， 比 
如 : “int**q=&p; ” 这 里 ，q 就 是 指 疝 一 级 指针 对 象 p 的 一 个 二 级 指 
针 ， 其 类 型 为 intt+*， 表 示 指 向 一 个 (指向 一 个 int 类 型 的 ) 指针 的 指针 。 
我 们 通过 代码 清单 7-9 来 进一步 观察 二 级 指针 、 一 级 指针 以 及 普通 对 象 
之 间 的 关系 。 


代码 清单 7-9 多 级 指针 概貌 





#include <stdio.h> 
#include <stdbool.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// 声明 了 一 个 int32 人 
int32 t x = 10, y = 


// 声明 了 一 个 指向 int32_t 类 型 的 指针 对 象 pP 和 q， 
// 并 分 另 将 对 象 x 的 地 址 与 对 | 象 y 的 地 址 对 它们 初始 化 
int32 t *p = &x, *q = &y; 


// 声明 了 一 个 指向 int32_t 指 针对 象 的 指针 对 象 pp， 
// 并 用 对 象 p 的 地 址 对 它 初始 化 
Int32_t **pp = &p; 


// 我 们 可 以 用 间接 操作 符 来 取 pp 的 内 容 















































// 这 里 ，*pp 的 什 人 即 对 象 x 的 地 址 
bool b = *pp == &x; 
printf("b = %d\n', b); 


// 修改 pp 的 内 容 ， 将 它 修改 为 指针 对 象 q 的 值 ; 
// 这 实际 上 是 就 是 将 指针 对 象 p 的 值 修改 成 了 q 的 值 ， 即 对 象 y 的 地 址 
“pp = q; 






































printf("p == q? %d\n", p == 9q); 


// 这 里 用 了 两 次 间接 操作 符 ， 第 en ee ee 
// 即 指针 对 象 q 的 值 。 第 二 次 则 是 以 站 为 地 址 ， 访 问 其 内 容 
// Ty 所 以 这 步 操作 二 接 将 对 象 y 的 人 修改 为 了 30 















































此生 刁 
于 宣 
IT 
人 












































火炎 


p = 
pn “a = %d\n", y); 





下 面 我 们 根据 代码 清单 7-9 中 的 示例 来 讲解 这 段 代 码 通 过 Apple 


LLVM 8.0 构 建 后 ， 在 macOS 10.12.4 下 运行 时 的 情况 。 其 中 主要 观察 指 
针对 象 pp、p、dq 的 内 容 变 化 。 通 过 在 bool b=*pp==&x; 这 名 打上 上 断 点 之 


后 ， 这 5 个 对 象 的 存储 位 置 如 图 7-4 所 示 。 


蝎 | < | 国 CDemo ) 其 Ox7fff5fbff7f0 
TFFFSFBFF7FQ 00 F8 BF SF FF 7F 00 80 68 F8 BF SF FF 7F 60 80 6C F8 BF SF FF 7F 00 60 14 00 900 00 0A 08 00 80 


图 7-4 ”执行 到 第 4 句 时 的 存储 器 内 容 





图 7-4 中 ，pp 对 象 的 地 址 为 00007F FF 5F BF F7 F0 (此 图 中 看 最 上 

面 ，CDemo 的 右边 那 一 串 文字 ) 。 我 们 很 容易 发 现 对 象 y 的 内 容 及 其 地 
址 ， 只 要 碍 找到 十 六 进 制 数 14 就 是 y 的 内 容 数值 ， 而 它 的 地 址 为 00007F 
FF 5F BF F808， 对 象 xz 的 内 容 只 要 查找 到 十 六 进 制 数 0A 即 可 ， 其 地 址 为 
00007F FF 5F BF F80C。 然 后 根据 对 象 x 的 地 址 来 查找 指针 对 象 p 的 地 
址 ， 可 以 看 到 是 00007F FF 5F BF F800; 根据 对 象 y 的 地 址 找到 指针 对 象 
q 的 地 址 一 一 00007F FF 5F BF F7 F8。 这 样 ， 我 们 已 经 清晰 地 看 到 指针 
对 象 pp 的 内 容 了 ， 正 是 指针 对 象 p 的 地 址 值 ! 当 我 们 对 指针 对 象 pp 做 一 


次 间接 操作 ， 那 么 其 实 就 是 访问 它 所 指 指针 对 象 的 值 ， 即 p 的 值 。 所 
以 ， 我 们 通过 *pp 与 x 的 地 址 进行 比较 能 获得 两 者 相等 的 结果 。 从 类 型 上 
讲 ，pp 是 int** 类 型 ， 那 么 *pp 就 是 int* 类 型 了 ，**pp 则 是 int 类 型 。 


之 后 ， 我 们 对 *pp 进 行 修改 ， 将 q 的 值 赋值 给 *pp， 这 样 其 实 就 是 将 
指针 对 象 p 的 值 间接 修改 成 了 q 的 值 。 我 们 看 图 7-5 所 示 的 变化 。 











图 7-5 ”*pp 修 改 之 后 的 内 容 变 化 


我 们 看 到 ， 图 7-5 中 ， 对 象 p 地 址 (00007F FF 5F BF F800) 的 内 容 
发 生 了 改变 ， 由 原来 的 00007F FF 5F BF F80C (对 象 x 的 地 址 〉 变 为 了 
00007F FF 5F BF F808 (对 象 y 的 地 址 ) 。 所 以 ，*pp 的 操作 就 是 将 pp 对 
象 的 值 (00007F FF 5F BF F800， 即 对 象 p 的 地 址 ) 作为 地 址 ， 然 后 访问 
其 内 容 〈 在 赋值 前 得 到 00007F FF 5F BF F80C， 即 对 象 z 的 地 址 ) 。 这 里 
的 赋值 操作 其 实 就 是 将 q 的 值 〈 即 地 址 00007F FF 5F BF F7 F8 所 包含 的 
内 容 ) 写 入 到 00007F FF 5F BF F800 地 址 中 去 。 这 样 就 间接 实现 了 将 指 
针对 象 q 的 值 赋值 给 了 指针 对 象 p， 使 得 指针 p 也 指向 了 对 象 y 的 地 址 。 








最 后 **pp 其 实 就 是 先 对 pp 做 一 次 间接 操作 ， 将 pp 地 址 的 内 容 作 为 地 
址 ， 访 问 其 内 容 ， 然 后 以 该 内 容 ， 即 〈*pp) 的 值 作为 地 址 ， 再 访问 一 
次 内 容 。 最 终 获 得 的 就 是 对 象 y 的 值 。“**pp=30; ”其 实 就 是 将 30 写 入 到 
对 象 y 的 地 址 中 去 ， 使 得 此 双重 间接 操作 间接 地 修改 了 对 象 y 的 值 。 下 面 





我 们 可 以 用 一 段 C 语 言 程序 更 深入 地 解释 一 下 “**pp=30; ”执行 的 过 程 。 


代码 清单 7-10”**pp=30; 的 执行 过 程 分 解 





#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


int32 ta = 10; 
int32 t *p = &a; 
int32_t **pp = &p; 


// 下 四 是 执行 "pp = = 30; 的 分 解 动作 
// 第 一 步 : 先 获取 pp 所 指 对 象 的 地 址 ， 用 address1 保 存 
UE address1 = (uintptr_t)pp; 












































// 第 二 步 : 以 address1 作 为 地 址 ， 再 访问 其 内 容 
// 然后 将 此 内 容 保存 为 address2。 这 一 步 相 当 于 执行 了 第 一 次 间接 操作 
uintptr_t address2 = *(uintptr_t*)address1; 



































// 第 三 步 : 最 后 以 address2 作 为 地 址 ， 将 30 写 入 其 中 。 
// 这 一 步 相 当 于 执行 了 第 二 次 间接 操作 
*(int32_t*)address2 = 30; 

















// 最 后 可 以 看 到 a 的 值 被 修改 为 39 
printf("a = %d\n", a); 








代码 清单 7-10 更 直观 地 解释 了 两 次 间接 操作 的 整个 过 程 。 通 过 这 个 
例子 ， 大 家 对 于 间接 操作 的 理解 应 该 更 为 深入 了 吧 。 最 后 跟 大 家 再 总 结 
一 下 : 在 声明 一 个 指针 对 象 时 ，* 号 表示 该 对 象 为 多 少 级 的 指针 对 象 ; 
在 表达 式 中 ，* 号 作为 单 目 操作 符 使 用 时 就 是 间接 操作 ， 表 示 以 它 的 操 
作 数 的 值 作为 地 址 ， 取 该 地 址 中 的 内 容 。 所 取 内 容 的 长 度 则 根据 类 型 来 
判定 ， 如 果 操 作 数 的 类 型 为 int32_t*， 那 么 取 int32_t 类 型 长 度 ( 即 32 位 ) 
整数 ， 如 果 操 作 数 的 类 型 为 int32_t** 类 型 ， 那 么 取 int32_t* 类 型 长 度 〈 即 
一 个 地 址 长 度 〉 的 整数 ， 如 果 操 作 数 的 类 型 是 float*， 那 么 取 float 类 型 
( 即 32 位 单 精 度 ) 浮 点 数 。 








我 们 下 面 用 图 7-6 来 展示 代码 清单 7-9 中 通过 pp 二 级 指针 对 象 间 接 修 
改 指针 对 象 p 的 值 以 及 对 象 y 的 值 的 过 程 。 


(通过 *pp 修 改 前 ) 


pp 地 址 : 7F FF SF BF F7 F0 p 地 址 : 7F FF SF BF F8 00 x 地 址 : 7F FF SF BF F8 0C 
7F FF SF BF F8 00 | 7F FF SF BF F8 0C 00 00 00 0A 


(通过 *pp 修 改 p 指 针对 象 的 值 之 后 ) 
pp 地 址 : 7F FF SF BF F7 F0 p 地 址 : 7F FF SF BF F8 00 y 地 址 : 7F FF SF BF F8 08 
| 7F FF SF BF F8 00 可 下 7F FF SF BF F8 08 | 00 00 00 14 | 


(通过 **pp 修 改 y 指 针对 象 的 值 之 后 ) 
y 地 址 : 7F FF SF BF F8 08 


pp 地 址 : 7F FF SF BF F7 F0 p 地 址 : 7F FF SF BF F8 00 
7FFF SF BF F8 00 | 7F FF SF BF F8 08 00 00 00 1E 


图 7-6 ”通过 二 级 指针 对 象 pp 修改 p 指 针对 象 及 y 对 象 值 的 过 程 示 意图 



















































图 7-6 中 ， 和 矩形 上 方 的 文字 表示 当前 对 象 名 以 及 其 地 址 ， 和 矩形 中 的 
十 六 进 制 数 串 表 示 当 前 对 象 的 值 ， 箭 头 表 示 当 前 指针 对 象 指 同 茶 一 个 对 
象 。 








7.6 指 回 用 户 目 定义 类 型 的 指针 


在 上 两 市 中 ， 我 们 基本 以 指向 整数 类 型 的 指针 作为 例子 。 其 实 除了 
指 问 整 数 、 浮 点数 等 基本 类 型 的 指针 外 ， 我 们 还 能 定义 指向 枚 举 、 结 构 
体 以 及 联合 体 类 型 的 指针 。 指 癌 枚 举 类 型 的 指针 与 一 般 指 回 基本 类 型 的 
指针 差不多 ， 只 不 过 类 型 变 为 枚 举 类 型 而 已 。 对 于 结构 体 以 及 联合 体 这 
种 带 有 各 自 成 员 对 象 的 类 型 而 言 ， 这 里 会 涉及 如 何 用 一 个 指向 结构 体 和 
联合 体 类 型 的 指针 对 象 去 访问 它们 成 员 的 问题 。 我 们 在 6.2 市 已 经 知 
道 ， 对 于 一 个 普通 的 结构 体 对 象 要 访问 其 成 员 时 ， 我 们 使 用 “.” 操 作 符 。 
而 如 果 我 们 要 通过 一 个 指 疝 结构 体 类 型 的 指针 去 访问 它 所 指 的 结构 体 对 
象 的 成 员 时 ， 我 们 必须 使 用 “->” 成 员 访 问 操作 符 。 

















下 面 我 们 举 一 些 例子 来 插 述 指向 用 户 自 定义 类 型 的 指针 的 声明 以 及 
使 用 ， 请 见 代 码 清单 7-11。 


代码 清单 7-11 指向 用 户 自 定 义 类 型 的 指针 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


// 定义 一 个 名 为 TRAFFIC_LIGHT 的 枚 举 ， 并 包含 三 个 枚 举 值 
enum TRAFFIC_LIGHT 














TRAFFIC_LIGHT_RED, 
TRAFFIC_LIGHT_YELLOW, 
TRAFFIC_LIGHT_GREEN 
然后 ， 直 接 声明 一 个 对 象 11ght， 以 及 指向 该 枚 举 的 指针 对 象 pe， 
// 直接 指向 对 象 light 
} light, *pe = &light,; 


// 我 们 也 可 以 用 以 下 这 种 更 普遍 的 形式 声明 一 个 指向 枚 举 类 型 的 指针 对 象 
























































enum TRAFFIC_LIGHT *pe2 = pe; 


// 由 于 1ight 并 没有 初始 化 ， 所 以 它 的 值 是 不 确定 的 ， 这 里 通过 指针 给 它 赋 值 
*pe2 = TRAFFIC_LIGHT_YELLOW; 









































// 输出 1 
printf("light = %d\n", light); 


// 定义 一 个 名 为 S 的 结构 体 


struct S 


int a; 
float f; 
enum TRAFFIC_LIGHT *pe; 


// 并 直接 声明 一 个 对 象 s 以 及 指向 该 结构 体 类 型 的 指针 对 象 p 
}s, *p = &s; 


// 利用 指针 对 象 p 间 接 为 对 象 s 的 成 员 赋 人 
p->a = 10; 

p->f = -0.5f; 

p->pe = &light; 


// 当然 ， 我 们 也 可 以 用 以 下 方式 来 访问 成 员 ， 
// 但 是 我 们 需要 注意 的 是 ， 这 里 必须 加 一 个 圆 括号 

// 因为 成 员 访 问 操作 符 . “的 优先 级 高 于 间接 操作 和 符 ^xw 
(*p).a += 10; 
(*p).f -= 1.6f; 


// 将 成 员 外 针 pe 所 指 的 枚 举 对 象 的 值 修改 为 TRAFFIC_LIGHT_GREEN， 
// *(*p) .pe 表达 式 相 当 于 : *((*p).pe) 
*(*p).pe = TRAFFIC_LIGHT_GREEN ; 


// 我 们 观察 对 象 s 的 成 员 ， 分 别 为 20 和 -1.5 和 2 
printf("a = %d, f = %f, light = %d\n", s.a, SsS.f, light); 


// 以 下 这 句 表达 式 就 相当 于 *(p->pe)， 因 为 成 员 访 问 操作 符 “->” 的 优先 级 高 于 间接 操作 符 “*” 
*p->pe = TRAFFIC_LIGHT_RED; 
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// 输出 9 
printf("light = %d\n", light); 


// 这 里 | 结构 体 S 声 明了 一 个 对 象 S2， 并 用 *p 对 它 初始 化 。 
// 这 就 相当 当 于 是) ] 对 象 S 对 S23 行 初始 化 
struct S s2 = *p; 







































































上 


// 输出 20，-1.5, 0 
printf("a = %d, f = %f, light = %d\n", s2.a, s2.f, *s2.pe); 


// 这 里 声明 了 一 个 指向 结构 体 S 的 二 级 指针 对 象 pp， 并 用 p 的 地 址 对 它 初始 化 
Struct S **pp = &p; 


// 我 们 只 能 通过 以 下 方式 来 访问 pp 的 成 员 
(*pp)->a -= 10; 

(**pp).f += 1.0f; 

*(*pp)->pe = TRAFFIC_LIGHT_YELLOW; 



























































// 输出 10，-0.5，1 
printf("a = %d, f = %f, light = %d\n", s.a, SsS.f, light); 








代码 清单 7-11 中 我 们 看 到 了 成 员 访问 操作 符 的 优先 级 要 高 于 间接 操 





作 符 的 优先 级 ， 所 以 我 们 在 刚 开 始 写 代 码 时 需要 注意 这 点 ， 以 免 摘 错 了 
逻辑 。 此 外 ， 对 于 指向 结构 体 或 联合 体 的 二 级 指针 对 象 ， 在 C++ 中 也 能 
直接 使 用 “->” 操 作 符 进行 成 员 访 问 ( 比 如 代码 清单 7-11 中 声明 的 pp， 可 
直接 用 “pp->a-=10; ”， 但 C 语 言 则 不 行 ， 这 点 对 于 学 过 C++ 的 朋友 需要 
格外 注意 。 





7.7 指针 与 数组 的 关系 





我 们 之 前 已 经 提 到 过 ， 指 针对 象 与 数组 对 象 属于 两 种 不 同 的 类 别 ， 
数组 属于 聚合 类 型 ， 而 指针 属于 标量 类 型 。 但 有 趣 的 是 ， 一 个 数组 对 象 
能 合法 地 隐 式 转 为 相应 的 指针 类 型 。 比 如 ， 一 个 int[5] 类 型 能 被 转 为 int* 
类 型 ， 使 得 一 个 指针 对 象 能 指向 一 个 数组 的 某 一 元 素 的 地 址 。 而 在 C11 
标准 中 也 是 明文 指出 除了 当 数 组 对 象 标识 符 作 为 sizeof、_Alignof、 单 
目 & 操 作 符 的 操作 数 之 外 ， 表 示 数 组 类 型 的 表达 式 会 被 转换 为 指向 该 数 
组 元 素 类 型 的 指针 类 型 〈 即 [type] 类 型 被 转换 为 type* 类 型 ) ， 而 该 表达 
式 的 值 则 指向 该 数组 对 象 的 初始 元 素 ， 并 且 不 再 是 一 个 左 值 。 所 以 ， 我 
们 通常 在 表达 式 中 引用 数组 对 象 标识 符 的 时 候 ， 实 际 使 用 的 是 指向 该 数 
组 首 个 元 素 地 址 的 指针 ， 我 们 可 以 将 数组 对 象 标识 符 作 为 间接 操作 符 的 
操作 数 。 另 外 ， 一 个 指针 对 象 也 能 通过 使 用 下 标 操作 符 来 访问 它 所 指向 
的 数组 缓存 中 的 相应 元 素 。 在 C 语 言 标准 中 ， 其 实 是 将 下 标 操作 翻译 为 
旨 针 与 整数 的 加 减法 操作 。 指 针 与 整数 之 间 的 加 减法 操作 与 一 般 整 数 之 
间 的 加 减法 有 所 不 同 ， 假 定 这 里 声明 了 一 个 指针 对 象 p 为 type*p， 那 么 
(Cp+1) 的 值 为 p+sizeof (type) ; (p+2) 的 值 为 ptsizeof (type) *2， 
以 此 类 推 。C 语 言 可 以 将 * 〈p+1) 写作 为 p[1];， 将 * (p+2) 写作 为 p[2]; 
而 (*p) 就 相当 于 * (p+0) ， 可 写作 为 p[0]。 


同 理 ， 对 间接 操作 的 逆 操 作 一 一 取 地 址 操作 而 言 ， 对 于 一 个 一 维 数 





组 ， 对 其 某 个 元 素 做 取 地 址 操作 就 相当 于 从 该 数组 首 地 址 加 上 指定 元 素 
所 在 的 偏 移 地 址 。 所 以 ， 像 (p+1) 与 &p[1] 是 等 同 的 。 这 里 大 家 要 注意 
的 是 ， 下 标 操 作 符 属于 后 级 操作 符 ， 其 计算 优先 级 要 高 于 单 目 取 地 址 操 
作 符 &&， 所 以 &p[1] 相 当 于 & (p[1])。 从 类 型 上 分 析 ，p 是 属于 type* 类 
型 ，(p+1) 仍然 属于 type* 类 型 ， 而 p[1] 就 是 type 类 型 了 (由 于 p[1] 相 当 
于 * (p+1) ) 。 所 以 ， 对 p[1] 再 做 取 地 址 操作 就 好 比 &* (p+1) ， 根 据 
我 们 在 7.4 节 最 后 所 提 到 的 ， 一 个 取 地 址 符 如 果 与 间接 操作 符 两 者 毗 
邻 ， 则 相互 抵消 ， 所 以 可 直接 得 到 它 与 (p+1) 完全 等 同 。 





代码 清单 7-12 比 较 详 细 地 描述 了 指针 与 数组 之 间 的 转换 以 及 指针 加 
减 运算 的 规则 与 特性 。 这 里 各 位 要 注意 的 是 ， 指 针对 象 只 能 用 加 法 和 减 
法 对 它们 进行 算术 计算 ， 而 不 能 用 乘除 法 。 当 然 ， 两 个 指针 对 象 之 间或 
一 个 指针 与 一 个 整数 之 间 也 不 能 使 用 按 位 逻辑 运算 。 


代码 清单 7-12 ”指针 与 数组 的 关系 及 算术 运算 





#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char * argv[]) 


// OP ne eh 并 对 它 初始 化 
int32 t ar[5] = { 1, 2, 3, 4, 5 }; 
































// 声明 了 一 个 指针 对 象 p， 并 用 数组 a 的 首 个 元 素 的 地 址 对 它 初始 化 
// 这 里 相当 于 : int32_t *p = &a[0]; 
int32 t *p = a; 


// 将 p 的 值 ， 即 数组 a 的 首 地 址 打印 
printf("a address: QOx%,.16tX\n", p); 


















































printf("*p = %d\n", *p); 


// hn op 
// 数组 索引 操作 符 [] 的 优先 级 比 取 地 址 操作 符 & 要 高 ， 
// 所 以 这 里 p = &a[1]; 又 相当 于 p = &(a[1]); 
























































p = &a[1]; 


// 这 里 *p 的 值 就 是 2， 即 a[1] 的 值 
printf("*p = %d\n", *p); 


// 将 p 的 值 打印 出 来 
printf("a[1] address: Ox%.16tX\n", p); 


// 声明 一 个 address 变 量 ， 用 于 记录 当前 指针 对 象 p 的 值 
uintptr_t address = (uintptr_t)p; 


p++; // 相当 于 p += 1; 此 时 ，p 指 向 了 数组 a[2] 元 素 的 地 址 
printf("p value: Ox%.16tX\n", p); 



























































een, 











printf("*p = %d\n", *p); 


// 上 面 的 p++ 就 好 比 : 
address += sizeof(*p); // *p 类 型 为 jnt32_t， 所 以 这 里 为 4 









































// 这 里 address 与 p 的 值 相等 
printf("Is equal? %d\n", address == (uintptr_t)p); 


// 我 们 将 指针 对 象 p 重 新 指向 数组 a 的 起 始 地 址 











p= ai 
p[3] += 10; // 相当 于 *(p + 3) += 10 
“(p+4) -= 5; // 相当 于 p[4] -= 5 


printf("a[3] = %d, a[4] = %d\n", a[3], a[4]); 


/** 除了 指针 对 象 与 整数 对 象 之 间 可 做 加 减 运算 之 外 ， 两 个 指针 对 象 之 间 也 能 做 减法 计算 */ 
// 这 里 让 指针 p 指 向 数组 a 的 1 号 元 素 。 这 里 a + 1 与 &a[1] 是 等 价 的 ， 

// 说 明 这 里 的 数组 对 象 标识 符 a 已 么 作为 指 商 其 首 个 元 素 地 址 的 指针 类 型 

p=a+1; 
int32_t *q = &a[3]; // 这 里 声明 指针 对 象 g， 并 将 它 指向 数组 a 的 3 号 元 素 
ptrdiff_t diff = q - p;  // 我 们 计算 0 间 的 差 值 


// 我 们 可 以 观察 到 q 与 p 之 间 的 差 值 为 2， 说 明 两 者 跨 了 2 个 元 素 
printf("diff is: %td\n", diff); 


// 这 里 p 与 q 两 个 指针 之 间 的 计算 相当 于 : 
diff = (intptr_t)q - (intptr_t)p; 
diff /= sizeof(*p); 

printf("diff is: %td\n", diff); 


















































































































































// 这 里 声明 了 一 个 数组 对 象 array， 其 类 型 为 jnt32_t* [5]， 

// 即 array 是 一 个 包含 5 个 元 素 的 数组 ， 其 每 个 元 素 的 类 型 为 jnt32_t*。 
// 这 里 由 于 array[3] 和 array[4] 没 有 被 显 式 初始 化 ， 

// 因此 它们 被 默认 初始 化 为 空 

Int32_t* array[5] = { p, dq, a }; 
















































































// 由 于 当前 p 指 向 a[1] 地 址 ， 所 以 输出 : array[6][6] = 2 
// array[9][9] 相 当 本 "array[9]， 我 们 也 可 以 用 **array。 
// **array 则 完全 可 以 体现 出 ， 当 数组 标识 符 用 于 表达 式 时 ， 
// 它 就 相当 于 指向 它 首 个 元 素 地 址 的 指针 ， 因 而 才能 作为 间 接 操作 符 的 操作 数 
printf("array[0][0] = %d\n", **array); 


// 这 里 相当 于 访问 指针 对 象 q 所 指 的 对 象 的 内 容 ， 输 出 : *array[1] = 
printf("*array[1] = %d\n", *array[1]); 


// 由 于 array[2] 的 值 即 为 数组 对 象 a 的 首 地 址 ， 

// 所 以 我 们 可 以 借助 array[2] 来 间接 访问 数组 a 的 元 素 。 

// 这 里 array[2][4] 也 就 相当 于 a[4]， 输 出 : array[2][4] = 
printf("array[2][4] = %d\n", array[2][4]); 

// 这 里 能 输出 OK! 

if (array[3] == NULL && array[4] == NULL) 















































































































































puts("OK!"); 


代码 清单 7-12 清 晰 地 描述 了 指针 与 数组 之 间 转 换 以 及 指针 的 算术 运 
算 。 不 过 这 里 需要 再 度 提 醒 的 是 ， 尽 管 一 个 数组 类 型 作为 表达 式 时 可 以 
被 隐 式 地 转换 成 相应 的 指针 类 型 ， 但 数组 对 象 类 别 与 指针 对 象 类 别 仍然 
是 两 个 不 同 的 类 别 ， 而 像 int[5] 类 型 与 int* 类 型 也 属于 不 同 的 类 型 。 此 
外 ， 一 个 指针 类 型 无 法 被 转换 为 一 个 数组 类 型 ， 即 便 用 投射 操作 也 不 
行 。 更 确切 地 说 ， 数 组 类 型 无 法 作为 一 个 投射 操作 符 的 操作 数 ， 即 
像 ” (int[5]) p” 这 种 表达 式 是 非法 的 。 








代码 清单 7-12 也 提 到 了 指针 与 整数 对 象 之 间 以 及 两 个 指针 对 象 之 间 
的 算术 计算 。 这 里 指针 所 参与 的 计算 只 能 是 加 减 算 术 计算 ， 而 不 能 是 乘 
除 。 当 指针 对 象 与 一 个 整数 对 象 参 与 计算 时 ， 指 针 的 值 相当 于 加 或 减 了 
该 整数 值 的 sizeof (* 指 针对 象 ) 倍 。 当 两 个 指针 对 象 相 减 时 ， 计 算 结果 
是 两 个 指针 的 差 值 再 除 以 sizeof(* 指 针对 象 )。 最 后 要 注意 的 是 ， 两 个 
类 型 相 兼 容 的 指针 对 象 只 能 做 减法 计算 ， 不 能 做 加 法 计算 。 





7.8” 指 问 数 组 的 指针 


我 们 上 一 市 讲述 了 一 维 数 组 与 一 级 指针 的 关系 ， 谈 到 了 一 个 一 维 数 
组 对 象 可 以 被 隐 陈 地 转 为 一 个 一 级 指针 对 象 ， 使 得 一 个 一 级 指针 对 象 能 
指 回 该 数组 的 东 个 元 素 。 但 之 前 我 们 已 经 提 到 过 ， 任 何 对 象 都 有 地 址 ， 
所 以 在 C 语 言 中 都 能 定义 指向 任 一 对 象 类 型 的 指针 ， 数 组 也 不 例外 。 如 
果 我 们 定义 了 一 个 数组 a: “int a[3]; ”， 那 么 大 要 声明 一 个 指向 int[3] 类 
型 的 指针 对 象 p 并 指向 a， 则 可 用 此 形式 :“int (*p) [3]=&a; ”。 这 里 ， 
对 象 p 束 是 指 同 数组 a 的 指针 ， 其 类 型 为 int(*) [3]， 表 示 指 同一 个 int[3] 
数组 类 型 的 指针 。 这 里 要 注意 的 是 ，0] 内 的 3 不 能 省 ， 因 为 这 里 的 数组 对 
象 a 是 一 个 定 长 数组 。(*p〉 的 类 型 则 是 int[3] 类 型 ， 所 以 我 们 可 以 通 
过 “(*p) [ 订 ” 或 “p[0][”( 上 市 已 经 提 到 过 ，(*p〉 相当 于 p[0]) 来 访问 
旨 针 p 所 指数 组 的 菏 个 元 素 。 








下 面 ， 我 们 将 通过 代码 清单 7-13 来 详细 地 给 大 家 介绍 一 下 指 问 数组 
的 指针 的 特性 与 用 法 。 


代码 清单 7-13” 指 同一 维 数组 的 指针 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


// 声明 了 一 个 数组 对 象 4， 具 有 5 个 元 素 
int a[] = { 1, 2, 3, 4, 5}; 


// 声明 了 一 个 指向 int 类 型 的 指针 对 象 p， 并 将 它 指向 数组 a 的 首 个 元 素 的 地 址 
































// int *p = a; 就 相当 于 : int *p = &a[9]; 
int *p = a; 


// 声明 了 一 个 指向 int[5] 数 组 类 型 的 指 针对 象 ， 并 用 数组 a 的 地 址 对 它 初始 化 
int (*pa)[5] = &a; 


// 与 sizeof(p) 结 果 相同 ， 因 为 两 者 都 是 指针 类 型 的 对 象 


printf("size of pa is: %zu\n", sizeof(pa)); 




































































// 这 里 Sizeof(*pa) 与 sizeof(*p) 的 结果 就 不 同 了 : 

// 因为 (*pa) 的 类 型 是 int[5]， 所 以 sizeof(*pa) 就 相当 于 sizeof(int[5]); 

// 而 (*p) 的 类 型 是 int， 所 以 sizeof(*p) 的 结果 就 相当 于 sizeof(int ) 

printf("size of (*pa) = %zu, sizeof (*p) = %zu\n", 
sizeof(*pa), sizeof(*p)); 














int sum = 0; 


for(int i = 0; i < 5; i++) 
sum += (*pa)[il]; // 这 里 需要 注意 ， 这 里 的 圆 括 号 不 能 省 
























































printf("sum = %d\n", sum); 


// 这 里 声明 了 一 个 二 维 数组 bp[3] [5] ， 并 对 其 初始 化 
int b[3][5] = { 

{1, 2, 3, 4, 5}, 

{6, 7， 8， 9, 10}; 

{11, 12, 13, 14, 15} 
































}; 


// 我 们 用 pa 指针 对 象 指 向 b 的 首 个 元 素 的 地 址 。 这 里 相当 于 : pa = &b[9] 
// 一 个 二 维 数组 其 本 质 是 一 个 数组 ， 该 数组 的 每 个 元 素 是 一 个 一 维 数组 。 
// b 是 一 个 合 有 3 个 元 素 的 数组 ， 其 中 每 个 元 素 是 一 个 int [5] 的 数组 对 象 
pa = b; 















































pa[9][9]++'/ 
(*(pa + 1))[90]--; // 相当 于 pa[1][9]-- 





uint64 t address = (uint64 t)pa; 
pa += 1; // 相当 于 pa = &b[1]; 
// pa += 1 也 可 看 作 : 


address += sizeof(b[0]); 





// b[9] 的 类 型 为 int[5] 
printf("address == pa? %d\n", (uint64 t)pa == address); 


printf("b[9][9] = %d, b[2][3] = %d\n", pa[-1][90], pa[l1][3]); 
int n = a[2]; 


// 声明 了 一 个 变 长 数组 对 象 v， 此 时 ，n 为 3， 所 以 v 具 有 三 个 元 素 


int v[n]; 


// 对 数组 对 象 v 的 每 个 元 素 进行 赋值 
v[0] = 1; v[1] = 2; v[2] = 3; 


// 声明 了 一 个 指向 变 长 数组 jnt[n] 的 指针 对 象 pv 
// 并 用 数组 对 象 v 的 地 址 对 它 初始 化 
int (pv)[n] = &v; 


















































n++， 
//_n++ 对 数组 对 象 v 以 及 指向 数组 对 象 v 的 指针 pv 均 无 影响 
// Vv 的 元 素 个 数 仍 然 是 3 个 ;，(*pv ) 的 类 型 jnt[n] 

// n 也 为 3 〈 这 里 的 n 不 是 声明 的 变量 n 的 值 ， 而 是 与 声明 变 长 数组 时 所 绑 定 的 值 ) 






































printf("n = %d\n", n); 
printf("size of (*pv) is: %zu\n", sizeof(pv[0])); 
printf("size of V is: %zu\n" sizeof(v)); 


// 声明 了 一 个 指 Ls Cn] 的 数组 的 指针 对 象 pv2 
int (*pv2)[n] = 


// 这 里 ，(*pv2 ) 的 大 小 ee * 4， 即 n 为 加 1 后 的 值 
printf("size of (*pv2) is: %zu\n", sizeof(pv2[0])); 

















printf("v[2] = %d\n", pv2[0][2]); 





代码 清单 7-13 详 细 描 述 了 指 同一 维 数组 的 指针 的 特性 以 及 使 用 方 
法 。 这 里 涉及 指向 一 维 数 组 的 指针 与 一 般 指 针 之 间 的 区 别 ， 比 如 int*p 和 
int (*pa) [5]， 前 者 指 癌 了 数组 对 象 a 的 首 个 元 际 的 地 址 ， 而 后 者 则 指 回 
了 数组 a 的 地 址 。 其 实 这 两 个 地 址 值 都 是 相同 的 ， 但 它们 的 概念 、 含 义 
都 不 相同 。 


然后 我 们 又 通过 将 指向 一 维 数组 的 指针 对 象 pa 指向 了 一 个 二 维 数组 
首 个 元 素 的 地 址 ， 这 样 我 们 就 能 对 指针 与 数组 之 间 的 关系 有 进一步 的 了 
解 了 。 与 一 维 数 组 其 实 类 似 ，a 的 类 型 为 int[5]， 它 能 被 隐 式 地 转换 为 
int*; 同样 ，b 的 类 型 为 int[3][5]， 那 么 它 能 被 隐 式 地 转换 为 int (*) [5]。 
这 里 大 家 能 进一步 摸 透 数组 与 指针 之 间 的 关系 ， 其 实 一 个 数组 对 象 能 隐 
含 地 表示 其 首 个 元 素 的 地 址 。 像 数组 a， 当 其 标识 符 用 于 一 般 的 表达 式 
时 ， 就 相当 于 &a[0]， 数 组 b 也 是 如 此 ， 当 其 标识 符 用 作 = 的 右 操作 数 
时 ， 就 相当 于 &b[0]。 由 于 b[0] 的 类 型 是 int[5]， 所 以 &b[0] 自 然而 然 地 就 
被 表达 为 int (*) [5]。 





最 后 一 部 分 我 们 描述 了 指 癌 变 长 数组 的 指针 的 特性 。 关 于 变 长 数 


组 ， 我 们 在 7.3 市 已 经 有 了 比较 详细 的 介绍 ， 这 里 不 再 装 述 。 





以 上 描述 的 是 指向 一 维 数 组 的 指针 ， 那 么 是 否 存在 指向 更 多 维度 数 
组 的 指针 呢 ? 答案 当然 是 肯定 的 。C 语 言 的 类 型 系统 是 相当 完备 的 ， 既 
然 存在 指向 一 维 数组 的 指针 ， 那 么 肯定 就 会 存在 指向 更 多 维 的 数组 指 
针 。 上 面 已 经 提 到 了 ， 声 明 一 个 指向 含有 3 个 元 素 的 一 维 数组 的 指针 p 的 
形式 为 :“int (*p) [3]; ”。 要 声明 指向 一 个 int[2][3] 二 维 数组 的 指针 qd 的 
形式 为 :“int (*q) [2][3]; ”，d 的 类 型 为 int (*) [2][3]”， 则 这 里 [2][3] 
这 两 个 方 括号 里 的 数 都 不 能 省 。 〈*q) 的 类 型 则 为 int[2][3]， 所 以 如 果 
我 们 要 查询 sizeof (*q) ， 那 么 得 到 的 大 小 为 sizeof 〈int) *3*2”。 代 码 
清单 7-14 简 单 介绍 了 指向 二 维 数组 的 方式 以 及 用 法 。 








代码 清单 7-14 ” 指 问 二 维 数组 的 指针 





#include <stdio.h> 


int main(int argc, const char * argv[]) 




















// 声明 了 一 个 二 维 数组 a， 具 有 2 个 元 素 ， 
// 其 中 每 个 元 素 为 一 个 jnt[3] 的 数组 
int a[2][3] = { 

{ 1, 2, 3}, 

{ 4, 5, 6} 





























// 声明 了 一 个 指向 二 维 数组 int[2][3] 的 指针 对 象 p， 
// 并 用 数组 a 的 地 址 对 它 初 始 化 
int (*p)[2][3] = &a; 


// 修改 二 ee 
(*p)[O][O] += 10 
printf("a[0][0] = %d\n", a[©0][0]); 


// 修改 二 维 数组 a[1] [2] 的 值 
p[9j[1][2] += 100; 
printf("a[1][2] = %d\n", a[1][2]); 












































// (*p) 的 大 小 为 2 * 3 * sizeof(int) 
printf("size of (*p) = %zu\n", sizeof(*p)); 


代码 清单 7-14 简 单 地 描述 了 指向 二 维 数组 的 指针 的 使 用 以 及 特性 ， 
这 些 可 依次 类 推 到 三 维 ， 甚 至 更 高 维 的 数组 指针 。 此 外 ， 指 向 二 维 数 组 
的 指针 能 直接 指向 一 个 三 维 数 组 的 首 个 元 素 的 地 址 ， 这 与 指向 一 维 数组 
的 指针 可 直接 指向 一 个 二 维 数组 的 首 个 元 素 的 地 址 的 特性 类 似 。 


7.9 void 类 型 、 指 向 void 类 型 的 指针 与 空 指针 











我 们 之 前 讲 到 的 类 型 都 是 有 其 具体 意义 的 类 型 。 在 C 语 言 中 还 有 一 
种 类 型 表示 “无 ”或 “ 空 ”， 用 void 关 键 字 来 表示 。void 一 般 用 于 函数 返回 
类 型 以 及 表示 空 的 形 参 列 表 ， 也 可 作为 表达 式 的 类 型 。 具 有 void 类 型 的 
表达 式 称 为 void 表达 式 ， 表 示 该 表达 式 不 返回 任何 值 ， 也 不 具有 任何 有 
意义 的 类 型 。 在 C 语 言 中 ， 大 部 分 表达 式 都 具有 某 个 有 意义 的 类 型 ， 不 
过 我 们 可 以 通过 投射 操作 ， 将 某 个 表达 式 强 制 转 为 void 表达 式 ， 比 如 : 
(void) 0， (void) (Ca+1) ， (void) (a=3) 等 都 是 属于 void 表达 
式 。void 表 达 式 除了 可 用 作为 逗号 操作 符 的 操作 数 以 及 三 目 条 件 操作 符 
的 “? ”后 面 和 “: ”后 面 的 操作 数 之 外 ， 一 般 不 可 用 作为 其 他 操作 符 的 操 
作 数 。 此 外 ，void 表 达 式 也 只 能 作为 对 void 类 型 投射 操作 的 操作 数 ， 而 
不 能 作为 对 其 他 类 型 投射 的 操作 数 。 像 以 下 表达 式 都 是 合法 的 : 









































// 这 里 ， 对 于 (void)(void)(1 + 2) 表 达 式 ，(void)(1 + 2) 这 个 子 表 达 式 就 作为 
// void 投射 操作 的 操作 数 。 
(void)0，(void)1; (void)(void)(1 + 2); 1 > 2 ? (void)9 : (void)1; 

在 C 语 言 中 ， 一 个 指针 可 以 指向 void 类 型 ， 即 该 指针 对 象 的 类 型 为 
void* 。 如 果 一 个 指针 对 象 是 指向 void 类 型 的 指针 ， 那 么 该 指针 可 被 隐 式 
转换 为 指向 任 一 对 象 类 型 的 指针 。 而 指向 任 一 对 象 的 指针 也 都 能 被 隐 式 
转 为 指 癌 void 类 型 的 指针 。 在 5.6 节 最 后 摘 述 C11 标 准 对 投射 操作 符 的 约 
束 时 已 经 提 到 :“ 涉 及 指针 类 型 的 转换 ， 除 了 茶 些 允许 指针 类 型 隐 式 转 








换 的 情况 ， 应 该 显 式 使 用 投 映 操 作 ”。 这 里 ， 所 谓 的 “ 某 些 允许 指针 类 型 
隐 式 转换 的 情况 ”就 是 指 void* 类 型 的 情况 。 因 而 void* 指 针 类 型 往往 在 C 
语言 社区 中 也 被 戏称 为 “万 用 指针 类 型 ”(universal pointer) 。 





代码 清单 7-15 举 了 一 些 使 用 指 癌 void 指针 的 例子 。 


代码 清单 7-15 ”指向 void 指 针 的 一 些 例子 





#include <stdio.h> 

int main(int argc, const char * argv[]) 
int a = 10; 
// 这 里 声明 了 一 个 指向 void 类 型 的 指针 对 象 p， 
// 并 用 对 象 a 的 地 址 对 它 初 始 化 


void *p = &a; 
































// 这 里 声明 了 一 个 指向 int 的 指针 对 象 q， 
// 并 直接 用 p 对 它 初始 化 。 这 里 不 需 要 使 用 投射 操作 做 关 型 转换 
int *q = p; 


























*q += 10; 
printf("a = %d\n", a); 


// 将 指向 void 类 型 的 指针 指向 一 个 临时 数组 对 象 的 地 址 
p = &(int[]){ 1, 2, 3 }; 




















// 这 里 ts hab 针 类 型 ， 
// 然后 对 该 数组 的 索引 为 1 的 元 值 做 加 2 修改 
((int( ~)[3])p)L9j[1] += 2; 


// 这 里 声明 一 个 指向 int[3] 数 组 的 指针 t， 
// 接 用 p 进 行 初始 化 ， 这 里 也 不 需要 任何 投射 操作 做 类 型 转换 
int (*t)[3] = p; 











































































































// 这 里 (*t) 的 类 型 为 jnt[3]， 可 直接 将 它 赋 值 给 指向 int 的 指针 q。 
// int[3] 到 int* 是 可 隐 式 转换 的 


本 七 


q 
a ea = %d\n", q[1]); 


























在 C 语 言 中 我 们 通常 使 用 一 个 空 指针 表示 一 个 无 效 的 、 或 未 经 初始 
化 的 指针 对 象 ， 空 指针 使 用 宏 NULL 来 表示 。C 语 言 中 的 NULL 往 往 会 被 
定义 为 (void*) 0， 即 类 型 为 指向 void 指 针 、 值 为 0 的 整数 常量 。 通 常 ， 


我 们 不 能 对 一 个 空 指 针 所 指 的 内 容 进 行 读 写 。 举 一 个 简单 的 例 
子 :“int*sp=NULL; ”， 这 里 p 就 被 初始 化 为 一 个 空 指 针 。 


一 般 来 说 ， 我 们 在 函数 里 声明 一 个 局 部 指针 对 象 时 ， 如 果 未 对 它 做 

意义 的 初始 化 ， 那 么 可 以 先 将 它 指 网 空 ， 人 否则 该 局 部 指针 对 象 的 值 是 
不 确定 的 ， 这 种 情况 在 C 语 言 社区 中 也 将 它 戏 称 为 “ 野 指 针 ”(wild 
pointer) ， 即 不 受 控 的 指针 。 如 果 用 空 NULL) 来 标识 该 指针 为 无 效 
指针 ， 那 么 显然 更 容易 做 判断 处 理 。 而 如 果 一 个 指针 对 象 指向 了 一 块 动 
态 分 配 的 内 存 空间 ， 当 此 内 存 空间 被 释 放 之 后 ， 那 么 我 们 也 可 以 将 该 指 
针 指 向 空 ， 表 示 它 已 经 失效 了 ， 否 则 该 指针 对 象 也 会 成 为 “< 野 指针 ”。 这 
对 声明 在 文件 的 作用 域 并 且 被 多 个 模块 所 访问 的 指针 对 象 来 说 尤为 有 
用 。 











7.10 字符 数组 与 字符 串 字 面 量 


在 C 语 言 中 ， 字 符 串 字 面 量 是 一 个 比较 特殊 的 类 型 。 在 C99 标 准 中 
只 有 默认 的 ASCII 字 符 集 的 字符 串 字面 量 以 及 系统 环境 定义 的 宽 字符 串 
字面 量 两 种 ， 而 C11 标 准 还 引入 了 UTF-8 字 符 串 、UTE-16 字 符 串 以 及 


UTF-32 字 符 串 。 





一 个 字符 串 字 面 量 会 自动 添加 一 个 \0' 字 符 ， 用 来 表示 该 字符 串 的 结 
束 符 。 该 结束 符 可 被 库 函 数 strlen 等 使 用 ， 用 于 获取 当前 字符 串 的 长 度 
《 即 字符 个 数 通 常 也 实现 为 字 节 个 数 ) 。 比 如 ，"abc" 是 含有 3 个 ASCII 
码 字 符 的 一 个 字符 串 ， 但 它 的 类 型 是 char[4]， 即 实质 上 是 一 个 含有 4 个 
ASCII 码 字符 的 数组 (最 后 一 个 字符 为 \0') 。u"abc" 是 含有 3 个 UTF-16 编 
码 字 符 的 一 个 字符 串 ， 它 的 类 型 为 char16_t[4] 的 数组 (最 后 一 个 字符 为 


u\0' ) O 








一 个 字符 串 字 面 量 的 类 型 虽然 是 一 个 数组 类 型 ， 但 相 比 于 数组 的 语 
法 体系 却 还 有 一 些 例外 特性 。 首先， 尽管 字符 串 字 面 量 的 类 型 是 一 个 字 
符 数 组 类 型 ， 且 不 是 常量 ， 但 C 语 言 标准 明确 指出 ， 对 字符 串 字 面 量 中 
的 字符 进行 修改 是 一 个 未 定义 的 行为 。 此 外 ， 字 符 串 字面 量 可 直接 给 一 
个 字符 数组 进行 初始 化 。 代 码 清单 7-16 列 出 了 这 些 特 性 。 














代码 清单 7-16 ”字符 串 字 面 量 的 一 些 特性 


#include <stdio.h> 
#include <string.h> 
#include <wchar.h> 


#include "uchar.h" 
int main(int argc, const char * argv[]) 


{ 











Ud 





// "abc" 是 一 个 兼容 ASCII 码 的 系统 编码 形式 的 字符 虽 
const char *asciiString = "Hello, world"; 


// u8" 你 好 ， 世 界 "是 一 个 UTF- 8 编码 的 字符 串 
const char *utf8String = u8" 你 好 ， 让 界 "， 


// ud" 你 好 ， 世 界 " 是 一 个 UTF-16 编 码 的 字符 串 
const char16_t *utf16String = u" 你 好 ， 世 界 " 



































// U" 你 好 ， 世 界 "是 一 个 UTF-32 编 码 的 字符 串 
const char32_t *utf32String = U" 你 好 ， 世 界 "， 


// L" 你 好 ， 世 界 " 是 一 个 系统 编码 形式 的 宽 字 符 串 
const wchar_t er = L" 你 好 ， 世 界 " ; 
































printf("asciiString: %s\n", asciiString); 
printf("utf8String: %s\n", utf8String); 


量 给 一 个 字符 数组 对 象 进行 初始 化 



































// 可 以 直接 | 个 字符 串 字 国 
// 此 时 ，s 的 类 型 为 char[4] 


char s[] = "abc"; 


















































// 这 里 要 注意 的 是 ， 数 组 对 象 s 所 在 的 地 址 并 不 与 字符 串 "abc" 所 在 的 地 址 相同 























printf("The address of s is: %.16tX\n", (uintptr_t)s); 


printf("The address of string is: %.16tX\n", (uintptr_t)"abc"); 


printf("size of s is: %zu\n", sizeof(s)); 























// 输出 结果 为 6， 除 了 hello 这 5 个 字符 外 最 后 还 有 一 个 '\0' 结束 符 ， 一 























// 因而 "hello" 的 类 型 为 char [6] 类 型 


printf("The size of string is: %zu\n", sizeof("hello")); 





















































// 当然 ， 我 们 也 可 以 用 一 个 字符 数组 字面 量 〈 即 匿名 数组 ) 对 一 个 数组 对 象 进行 初始 化 


char a[] = (char[]){ 'a', 'b', 'c', '\0" }; 
// 我 们 调 Rm 
// 如 果 相同 返回 90， 否则 返回 一 个 负数 说 明 s 的 内 容 小 于 a 的 内 容 ; 
// 返回 一 个 正 数 说 明 s 的 内 容 大 于 a 的 内 容 

int equal = strcmp(s, a); 

printf("Result is: %d\n", equal); 


// 这 里 字符 数组 对 象 b 尽 管 含有 6 个 字符 元 素 ， 但 字符 串 长 度 仍然 为 3， 
// 因为 索引 3 元 素 为 '\0'， 表示 字符 串 结束 符 
char b[] = { 'a', 'b', 'c', Ne 'd', 'e' }; 


































































































printf("array b size: %zu\n", sizeof(b)); 
printf("b string length: %lu\n", strlen(b)); 


// 比较 字符 数组 b 与 字符 串 s 是 否 相 同 
equal = strcmp(b, s); 
printf("equal is: %d\n", equal); 

















char b[] = s; ”这 人 句 是 非法 的 ! 不 能 将 一 个 数组 对 象 给 另 一 个 数组 对 象 进行 初始 化 








标准 库 头 文件 <string.h> 中 列 出 了 许多 丰富 的 字符 串 操作 函数 ， 比 如 
字符 串 比 较 、 获 取 字 符 串 长 度 、 字 符 串 找 贝 等 。 代 码 清单 7-16 展 示 了 C 
语言 中 字符 串 字 面 量 的 特性 以 及 如 何 用 字符 数组 表示 一 个 字符 串 的 方 
式 。 如 果 各 位 在 编译 环境 中 没有 <uchar.h> 头 文件 ， 那 么 可 以 使 用 5.1.7 节 
中 的 代码 清单 5-8 作 为 头 文件 进行 包含 。 














C 语 言 中 ， 字 符 串 字面 量 另 一 个 有 趣 特性 就 是 可 进行 拼接 。 相 邻 几 
个 字符 串 字 面 量 可 拼接 在 一 起 ， 形 成 一 个 字符 串 字 面 量 ， 比 如 : 字符 
串 "abc""def" 即 可 表示 一 个 完整 的 字符 串 "abcdef"。 两 个 字符 串 字 面 量 之 
间 可 以 有 和 零 个 或 多 个 空 日 符 分 隔 。 但 这 里 要 注意 的 是 ， 进 行 拼接 的 几 个 
字符 串 的 类 型 必须 一 致 ， 比 如 几 个 UTF-8 编 码 的 字符 串 可 进行 拼接 ， 几 
个 宽 字 符 串 字面 量 也 可 进行 拼接 ， 但 一 个 UTF-16 字 符 串 与 一 个 宽 字 符 
串 字 面 量 之 间 就 无 法 进行 拼接 。 在 字符 串 字 面 量 进行 拼接 时 ， 无 前 绥 的 
字符 串 字 面 量 可 被 任意 拼接 ， 这 将 形成 在 所 拼接 的 字符 串 字 面 量 中 含有 


茶 一 前 级 的 字符 串 类 型 。 代 码 清 单 7-17 将 介绍 字符 串 拼接 特性 。 





























代码 清单 7-17 字符 串 字 面 量 的 拼接 特性 





#include <stdio.h> 
#include <string.h> 
#include <wchar.h> 


#include <uchar.h> 

int main(int argc, const char * argv[]) 
// 这 里 ，"a" 与 "b" 之 间 用 一 个 空格 分 隔 ，"b" 与 u"c" 之 间 没 有 任何 空白 符 。 
// 在 所 有 字符 串 字 面 量 中 由 于 多 字面 量 u"c" 具 有 前 缀 U， 


个 
二 第 十 量 

// 所 以 整个 字符 串 为 一 个 UTF-16 编 码 的 字符 串 u"abc" 

const char16 _t *utf16String = "a" "b"u"c" 






































































































































// 这 里 与 上 述 字 符 串 字面 量 等 价 














Utf16St 


ring 二 [Uh UC 


// 习惯 上 ， 一 般 我 们 可 以 这 么 写 









































utf1i6String = a me 
// 字符 串 字面 量 也 可 以 用 换行 分 隔 ， 换 行 也 属于 空 
const char xs = "d" "e" 
i 
printf("s = %s\n", s); 


// 以 下 这 种 字符 上 
































拼接 方式 是 错误 的 。u 前 组 字 盏 








Ud 

















耳 








const char16_t *errorString = u"a™" U"b" "c",; 


时 与 U 前 缀 的 字 国 




















台 b 
月 E 





并 接 在 一 起 








7.11 完整 与 不 完整 类 型 





在 C 语 言 中 ， 类 型 被 划分 为 对 象 类 型 和 函数 类 型 。 在 一 个 翻译 单元 
内 ， 一 个 对 象 类 型 在 多 个 位 置 可 能 是 不 完整 的 ， 也 可 能 是 完整 的 。 所 谓 
不 完整 类 型 就 是 指 缺 乏 足够 的 信息 去 判定 用 该 类 型 所 声明 对 象 的 大 小 。 


在 C 语 言 中 ， 一 个 void 表达 式 表示 不 存在 值 ， 此 类 型 是 一 个 不 完整 
类 型 ， 并 且 不 能 对 它 隐 式 或 显 式 转换 为 其 他 类 型 。 如 果 有 具有 其 他 类 型 表 
达 式 的 计算 结果 为 一 个 void 表达 式 ， 那 么 其 值 和 所 表示 的 标识 符 都 会 被 
丢弃 。 比 如 ， (void) (2+3) ; 这 个 表达 式 就 是 一 个 void 表 达 式 ， 它 不 
能 给 任 一 类 型 的 对 象 赋值 。 








只 含有 一 个 枚 举 类 型 、 结 构 体 、 联 合体 标识 符 的 声明 也 是 不 完整 类 
型 ， 因 为 它们 没有 任何 信息 来 描述 目 己 。 








一 个 指向 不 完整 类 型 的 指针 类 型 是 一 个 完整 类 型 ， 因 为 指针 类 型 对 
象 的 大 小 明确 ， 所 以 指 网 void 类 型 的 指针 也 属于 完整 类 型 。 代 码 清单 7- 
18 举 了 一 些 例子 进行 说 明 。 





代码 清单 7-18 ”完整 与 不 完整 类 


疏 





#include <stdio.h> 




















// 这 里 声 et ha he 型 ， 
// 由 于 缺乏 对 该 类 型 的 明确 定义 ， 因此 在 当前 翻译 单元 的 这 个 位 置 ， 它 是 一 个 不 完整 类 型 
struct MyStruct,; 



























































static void foo(void ) 






















































































{ 
// 这 里 对 象 p 是 一 个 指向 MyStruct 结 构 体 的 指针 ， 
// struct MyStruct* 是 一 个 完整 类 型 
Struct MyStruct *p = NULL， 
// 这 里 如 果 写 : struct MyStruct s; 将 会 报错 。 
// 一 个 不 完整 类 型 不 能 用 来 声明 该 类 型 的 一 个 对 象 。 
printf("The size is: %zu\n", sizeof(p)); 
// 这 里 表达 式 (void)(2 + 人 
// 因此 可 以 加 在 return 语 句 后 面 返回 。 如 果 这 里 缺 省 (void)， 将 
return (void)(2 + 3); 

} 





会 编译 报错 
































// 由 于 这 里 对 结构 体 MyStruct 进 行 了 明确 的 定义 ， 所 以 在 当前 翻译 单元 的 这 个 位 置 














// 它 现在 是 一 个 完整 类 型 了 。 
struct MyStruct 
{ 





int 1i; 
float f; 






































// 由 于 在 此 刻 ， 
































// 如 果 要 定义 : struct MyStruct s; 编译 器 将 
// 但 可 定义 指向 MyStruct 结 吉 构 体 类 型 的 指 针对 象 作 大 
struct MyStruct *p; 


人 

















MyStruct 尚 未 定义 完成 ， 因 此 它 在 ee 
成 员 





// 如 果 一 个 结构 体 至 少 含有 一 个 命名 成 员 对 象 ， 那么 最 后 可 跟 个 不 指定 大 小 的 数组 。 





// 最 后 不 指定 大 小 的 数组 对 象 也 是 一 个 不 完整 类 型 














但 数组 元 素 的 类 型 必须 是 














// 所 以 这 里 array[i] 的 类 型 是 void*， 它 是 一 个 完整 类 型 
// 成 员 array 不 占 MyStruct 结 构 体 类 型 的 大 小 


void* array[]; 











int main(int argc, const char * argv[]) 


foo( ); 


// 一 个 完整 类 型 可 以 声明 该 类 型 的 一 个 对 象 
Struct MyStruct S { 10，0.5f }; 
printf("The value ee %f\n", Ss.i + Ss.f),; 


// 在 64 位 系统 下 ， 


printf("size is: 











%zu\n", sizeof(s)); 


由 于 一 个 不 完整 类 型 无 法 确定 其 大 小 ， 
_Alignof 的 操作 数 。 


结构 体 MyStruct 类 型 的 大 小 为 16 个 字 节 


完整 的 ， 





因此 它 不 能 作为 sizeof、 


7.12 灵活 的 数组 成 员 


在 C 语 言 中 ， 在 至 少 含有 一 个 命名 成 员 对 象 的 结构 体 中 ， 其 最 后 一 
个 成 员 可 以 是 一 个 不 完整 数组 类 型 ， 即 不 指定 数组 长 度 〈 如 7.11 节 的 代 
码 清 单 7-18 中 定义 的 结构 体 所 示 ) ， 该 成 员 被 称 为 灵活 的 数组 成 员 。 在 
大 部 分 情况 下 ， 灵 活 的 数组 成 员 是 被 忽略 的 ， 而 结构 体 的 大 小 也 不 把 灵 
活 的 数组 成 员 给 算 进去 ,但 是 字 市 填充 会 受到 灵活 的 数组 成 员 类 型 的 影 
啊 。 妆 我 们 用 “.” 或 “->” 成 员 访 问 操 作答 去 访问 灵活 的 数组 成 员 时 ， 该 成 
员 的 偶 移 量 往往 就 是 结构 体 目 身 大 小 。 














代码 清单 7-19 给 出 了 灵活 的 数组 成 员 的 一 些 特性 以 及 常用 实践 方 
Ts 


代码 清单 7-19 ”灵活 的 数组 成 员 





#include <stdio.h> 

#include <stddef.h> 

#include <stdlib.h> 

int main(int argc, const char * argv[]) 
struct Test1 


int8_t b; 




















// 这 里 d 就 是 灵活 的 数组 成 员 ， 这 里 如 果 不 声明 此 成 员 ， 

// 那么 结构 体 Test1 的 大 小 仅 为 1 个 字 节 ; 但 声明 了 此 成 员 之 后 ， 

// 为 了 对 该 成 员 访 问 的 需要 ， 而 对 整个 Test1 类 型 做 了 字 节 填充 ， 到 8 个 字 节 
double d[]; 








}; 


// 获得 成 员 d 所 在 Test 结 构 体 中 偏 移 量 
size t offset = offsetof(struct Test1, d); 


// 这 里 偏 移 量 与 结构 体 Test 的 大 小 都 一 样 ， 均 为 8 个 字 节 
printf("offset is: %zu\n", offset); 







































































printf("size is: %zu\n", sizeof(struct Test1) ) ， 


struct Test2 














// 这 里 array 是 灵活 的 数组 成 员 。 
// 于 array 所 在 的 偏 移 位 置 正好 是 与 nt 对 齐 的 ， 
// 因此 整个 结构 体 Test2 无 需 再 做 字 节 填充 


int array[]; 
























































}; 


printf("size of struct Test2: %zu\n", sizeof(struct Test2)); 




















// 这 里 声明 了 一 个 Test2 结 构 体 数组 对 象 Ls， 它 共有 三 个 元 素 。 
// 这 里 相当 于 : ts[0].a = 10; ts[1].a = 20; ts[2].a = 30; 
Struct Test2 ts[] = {{ 10}, {20}, {30}}; 



































// 这 时 我 们 可 以 很 清晰 地 观察 到 ， 

// 结构 体 Test2 中 的 array 成 员 所 在 偏 移 也 正好 是 Test2 的 大 小 ， 

// 这 样 当 我 们 访问 ts 数组 的 第 一 个 元 素 的 array 成 员 时 ， 

// 该 array 正 好 指向 第 二 个 元 素 的 起 始 地 址 。 

// 这 就 好 比 : ts[0].array = &ts[1]; ts[1].array = &ts[2]; 
int sum = ts[0],array[0] + ts[1].array[0]; 
































// 这 里 sum 的 结果 为 20 + 30 = 50 
printf("sum = %d\n", sum); 


// 灵活 的 数组 成 员 还 有 一 种 常用 使 用 方式 是 对 整个 结构 体 类 型 做 动态 存储 分 配 ， 

// 这 样 ， 我 们 可 以 根据 当前 上 F 文 来 箭 定 灵活 的 数组 成 员 到 底 给 丛 它 分 配 多 大 的 存储 空间 。 
// 比如 这 里 给 pt 所 指向 的 Test2 结 构 体 对 象 中 的 array 成 员 ， 

// 分 配 了 变量 sum 所 指定 的 数组 元 素 个 数 

Struct Test2 *pt = malloc(sizeof(*pt) + sizeof(double[sum])); 


// 这 里 用 到 了 在 第 8 章 将 会 讲 到 的 for 循 环 语句 
for(int i = 0; i < sum; I++) 
pt->array[i] = i+1.0; 
































ee 


































































































double result = pt->a; 


for(int i = 0; i < sum; i++) 
result += pt->array[i]; 


printf("result is: %f\n", result); 





代码 清单 7-19 中 用 了 C 语 言 标准 库 的 malloc 函 数 ， 该 函数 从 存储 堆 
空间 动态 分 配 指 定 的 存储 空间 大 小 ， 其 原型 包含 在 了 <stdlib.h> 标 准 库 头 
文件 中 。 


713 水 章 小 汪 


本 章 主 要 讲述 了 C 语 言 中 的 数组 与 指针 相关 话题 。 本 章 也 是 相对 比 
较 有 难度 的 草 市 ， 硕 望 C 语 言 初学 者 能 反复 阅读 、 实 践 。 数 组 与 指针 类 
型 可 进行 各 种 组 合 、 变 化 ， 这 也 体现 出 C 语 言 类 型 系统 的 强大 与 灵活 ， 
但 又 不 失 简 洁 性 。 如 果 能 把 本 章 内 容 掌 握 好 ， 那 么 对 于 C 语 言 的 一 大 主 
要 问题 也 就 解决 了 。 











至 此 ， 关 于 C 语 言 中 的 类 型 就 全 都 讲解 完了 。 第 8 章 与 第 9 章 将 分 别 
介绍 C C 语 言 中 的 控制 流 语 名 以 及 函 数 。 





第 8 章 C 语 言 的 控制 流 语 句 


第 5 一 7 章 主要 讲解 了 C 语 言 中 的 各 种 对 象 类 型 以 及 各 种 字面 量 ， 随 
之 讲解 了 对 象 的 声明 以 及 一 些 简 单 的 算术 逻辑 计算 、 赋 值 语句 的 写法 。 
本 章 将 为 大 家 介绍 C 语 言 的 控制 流 语句 ， 用 来 表达 语句 的 分 文 和 循环 执 
行 。 我 们 将 先 介绍 去 号 表达 式 与 条 件 表达 式 ， 这 两 个 表达 式 具 有 魔法 般 
的 表现 力 ， 往 往 能 把 一 些 语 句 的 表达 进行 简化 。 随 后 ， 我 们 会 介绍 C 语 
言 中 的 选择 语句 〈selection statement) 证 else 以 及 switch-case，C 语 言 中 
的 选择 语句 就 是 我 们 通常 所 谓 的 分 支 语 句 。 紧 接着 会 介绍 while、do- 
while 以 及 for 和 迭代 语句 来 表示 循环 ， 执 行 一 次 循环 又 可 称 为 执行 一 次 迭 
代 。 最 后 我 们 会 介绍 C 语 言 中 的 goto 跳 转 语 句 ， 这 是 最 能 体现 处 理 器 控 
制 流 执行 的 表达 式 ， 但 在 使 用 时 需要 注意 一 些 事项 。 


8.1 过 号 表达 式 


C 语 言 支 持 逗 号 表达 式 ， 用 于 将 若干 表达 式 按 指定 次 序 执行 ， 最 终 
返回 最 后 一 个 表达 式 的 结果 。 比 如 ， 像 inta= (0，2，3) ; 这 条 语句 执 
行 后 ，a 的 值 为 ?。 喜 号 操作 符 是 一 个 双 目 操作 符 ， 其 左边 的 操作 数 称 为 
左 操作 数 ， 其 右边 的 操作 数 则 称 为 右 操作 数 。 比 如 表达 式 (0，2) 中 ， 
0 是 左 操作 数 ，2 是 右 操作 数 。 喜 号 表达 式 的 左 操作 数 与 右 操作 数 之 间 有 
一 个 顺序 点 ， 因 此 右 操作 数 能 确保 在 左 操作 数 所 产生 的 所 有 副作用 完成 
后 再 进行 执行 。 这 个 特点 就 与 分 号 的 作用 类 似 。 不 过 之 所 以 要 引入 去 
表达 式 ， 其 主要 目的 是 将 最 后 一 个 表达 式 的 计算 结果 给 返回 出 来 ， 而 分 
号 则 表示 整个 表达 式 的 终结 ， 并 不 具备 这 个 特性 。 











在 使 用 逗号 表达 式 的 时 候 还 需 注意 ， 由 于 逗号 操作 符 的 优先 级 是 最 
低 的 ， 因 此 去 号 表达 式 往往 会 用 圆 括号 操作 符 括 起 来 ， 使 得 它们 作为 一 
个 整体 的 基本 表达 式 不 会 被 其 他 操作 符 分 隔 开 。 代 码 清单 8-1 列 举 了 去 
号 表达 式 的 特性 以 及 需要 注意 的 事项 。 





代码 清单 8-1 逗号 表达 式 





#include <stdio.h> 


int main(int argc, const char * argv[]) 





// = 前 的 int ay 它们 之 间 的 逗号 表示 对 标识 符 的 分 隔 ， 
// em lt 于 为 逗号 操作 符 的 功能 仅 用 于 表达 式 。 

// = 后 面 的 (2，3， 4) 则 是 一 - 个 去 号 表达 式 ， 表 示 给 对 象 b 赋 值 为 4 

// 这 条 语句 相当 于 : int a; 2; 3; int b = 4; 





















































int a, b = (2, 3, 4); 














// 这 里 相当 于 : a = 2; b = 3; 4; 
a=2, b= 3, 4; 
printf("a = %d, b = %d\n", a, b); 


// 这 里 相当 于 b = 3; a = 4;， 因 为 赋值 操作 符 的 优先 级 要 大 于 逗号 操作 符 
a= (b= 3, 4); 
printf("a = %d, b = %d\n", a, b); 


// 尽管 这 里 有 后 级 ++ 操 作 符 ， 但 之 前 已 经 提 到 过 ， 逗 号 操作 符 的 左右 操作 数 之 间 存 在 顺序 点 
md 需要 处 理 完 左 操作 数 所 产生 的 所 有 副 作 / 




















































































































大 | 
// 因而 ， 这 里 相当 了 
// a 和 b 的 值 均 为 8 
a= (b++，b += 4); 
printf("a = %d, b = %d\n", a, b); 











FF: b++; int tmp = b += 4; a = tmp; 














// 这 里 就 相当 于 : b = at+; b=b- 1; 
b= (b= at+, b - 1); 
printf("a = %d, b = %d\n", a, b); 














在 使 用 逗号 表达 式 时 还 需要 注意 一 点 ， 当 逗号 作为 特定 上 下 文 的 特 
定 分 隔 语义 使 用 时 ， 它 就 不 能 做 逗号 表达 式 的 操作 符 使 用 了 ， 此 时 可 以 
用 圆 插 号 将 整个 逗号 表达 式 括 起 来 作为 一 个 整体 的 基本 表达 式 ， 这 样 可 
以 将 作为 操作 符 的 逗号 与 表示 分 隔 用 的 去 号 进行 区 分 。 比 如 : 
printf (“at+b=%d，a-b=%d\n”， (b++，a+b) ，a-b) ; 里 ， 表 达 式 
Cb++，at+b) 的 圆 括号 就 不 能 省 ， 因 为 其 圆 括 号 外 的 逗号 用 于 分 隔 参 
数 。 














8.2 ”条件 表达 式 





在 C 语 言 中 有 一 种 非常 便捷 的 用 于 执行 条 件 分 文 的 表达 式 ， 即 条 件 
表达 式 。 它 是 一 个 三 目 表 达 式 ， 由 标点 符 写 ? 与 : 共同 构成 。 其 表达 式 
的 形式 为 : 





布尔 表达 式 ? 表达 式 1 : 表达 式 2 





这 组 表达 式 的 执行 逻辑 为 ， 如果 布 尔 表达 式 的 值 为 “< 真 "， 那 么 执行 
表达 式 1; 人 否则 执行 表达 式 2。 正 由 于 这 里 的 ? 与 : 共同 构成 了 一 个 三 目 
操作 符 ， 所 以 其 操作 数 也 就 有 3 个 一 一 ? ”之 前 的 布尔 表达 式 、“: ”之 
前 的 表达 式 1， 以 及 “: ”之 后 的 表达 式 2。 三 目 操 作 符 的 优先 级 比较 低 ， 
它 仪 比 赋值 操作 符 要 高 一 级 而 已 。 





代码 清单 8-2 展 示 了 表达 式 的 用 法 以 及 一 些 需 要 注意 的 地 方 。 


代码 清单 8-2 条 件 表达 式 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


int a = 10; 
int b; 


// 由 于 条 件 表 达 式 的 ?与 : 操作 符 优先 级 大 于 gh 
所 以 后 面 的 (b = 0 上 凡 

// 否则 aa > 0? b=1: 1 相当 (a > 07， b=1:b)= -1; 

// 这 样 就 会 引发 编译 报错 

// 这 里 a > 9 的 表达 式 为 真 ， 所 以 执行 b = 1 子 表达 式 

a>07?b=1: (b= -1); 

printf("b = %d\n", b); 
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et 






























































// 这 里 a < 0 的 结果 为 假 ， 所 以 执行 a - 19 的 表达 式 
// 因此 ， 整 个 结果 表达 式 为 : b = a - 19; 
b=a<07?a+10 :a - 10; 

printf("b = %d\n", b); 





8.3 if-else 语 人 句 








if-else 语 句 在 C 语 言 中 属于 一 种 选择 语句 ， 用 来 表达 不 同 的 执行 分 
文 。 让 语句 的 形式 为 : 


if ( 表达 式 ) 语句 ， 


表示 当 表 达 式 为 真 时 执行 语句 。 





如 果 我 们 要 表达 : 当 表 达 式 为 假 时 执行 男 一 条 语句 ， 那 么 可 以 添加 
else。 其 形式 为 : 


if ( 表达 式 ) 语句 1 


else 语句 2，; 





表示 当 表 达 式 为 真 时 执行 语句 1， 人 否则 执行 语句 2。 


C 语 言 中 的 这 else 语 名 与 我 们 在 工作 中 遇 到 的 分 文 流 程 图 很 类 似 。 比 
如 图 8-1 所 示 的 场景 。 


处 理 6 处 理 7 


图 8-1 ”if-else 逻 辑 流程 图 


图 8-1 中 ， 处 理 1、 处 理 2 到 处 理 3 的 分 支 逻 辑 就 是 庄 逻辑。 表示 : 











if( 表 达 式 1 为 真 )《{ 执行 处 理 2 } 执行 处 理 

















CD 








说 明 只 有 当 表 达 式 为 真 时 执行 处 理 2 的 逻辑 ， 但 无 论 表 达 式 是 否 头 
真 ， 最 终 都 会 执行 到 处 理 3 的 逻辑 上 。 


而 从 处 理 4 到 处 理 7 展 现 的 是 if-esle 的 逻辑 。 表 示 : 

















if( 表 达 式 2 为 真 ) { 执行 处 理 5 } else { 执行 处 理 6 } 执行 处 理 7 





























说 明 当 表达 式 2 为 真 时 ， 执 行 的 是 处 理 5 的 逻辑 ， 如 果 为 假 则 执行 处 
理 6 的 人 逻辑， 最 终 都 执行 到 处 理 7 的 逻辑 。 


代码 清单 8-3 则 展示 了 if-else 语 句 的 具体 用 法 以 及 需要 注意 的 一 些 事 
项 


~o 


代码 清单 8-3” ”if-else 语句 





#include <stdio.h> 


int main(int argc, const char * argv[]) 


{ 
int a = 10, b= 0, c= 1; 








// 这 里 的 if 语 句 表 明 ， 当 a > 0 时 执行 bp = -1; 
// if 语 句 后 面 可 以 跟 一 条 语句 





















































// 这 里 需要 注意 的 是 ， 下 面 的 b++; 语 句 无 论 if 中 表达 式 的 条 件 是 否 为 真 都 会 执行 。 




















































































































// 因为 if 语 句 后 只 能 跟 一 条 语句 (这 里 的 b=-1; 就 是 一 条 语句 ， 而 b++; 则 属于 男 一 条 ) ， 
// 因此 这 里 的 b++ 与 上 述 的 b++ 属 于 相同 位 置 ， 即 在 if 语 句 之 外 。 
if(a > 20) 
b = -1; b++; 
// 如 果 我 们 要 在 一 条 if 语 句 内 包含 多 条 语句 ， 那 么 可 以 用 语句 块 
if(a > 0) 
// 当 a > 0 为 真 时 ， 执 行 这 两 条 语句 
b++; 
C++， 
} 

















// 这 里 使 用 了 if-else 语 句 ， 说 明 当 a < 0 为 真 时 执行 b- - ; 
// 如 果 为 假 则 执行 c++; 












































else // 这 里 else 的 用 法 与 if 一 样 ， 后 面 可 跟 一 条 语句 























if(c > 0) 


att+，; 
b++; 


printf("a = %d, b = %d, c = %d\n", a, b, c); 


// if 语 句 本 身 也 属于 一 条 语句 ， 因 此 
if(a > 0) 
if(b > 0) 
if(c > 0) 





puts("OK!"); 







































































// 相当 于 : 
if(a > 0) 

if(b > 0) 

if(c > 0) 
puts("OK!"); 

} 
} 
// if 与 else 后 面 可 直接 跟 一 个 空 语句 ， 这 么 一 来 ，if 或 else 则 不 执行 任何 操作 。 
if(a > 0); // 这 是 一 条 跟 在 if( ) 后 面 的 空 语 句 
if(a > 0) 

a++; 
else // 这 是 一 条 跟 在 else 后 面 的 空 语句 


























代码 清单 8-3 中 涉及 C 语 言 中 的 语句 (statement) 语法 问题 ， 这 里 先 
简单 提 一 下 。C 语 言 一 共有 以 下 几 种 语句 : 标签 语句 、 复 合 语 句 、 表 达 
式 语 句 、 选 择 语 句 、 和 迭代 语句 、 跳 转 语句 。 这 里 像 过 Ca>0) 、b=-1; 
b++; 等 都 属于 一 条 语句 。if (a>0) 是 一 条 选择 语句 ; b=-1; 则 是 表达 
式 语句 ;而 复合 语句 是 由 {} 包 围 的 一 个 语句 块 ， 其 中 {} 中 可 包含 多 条 语 
句 。 这 里 除了 表达 式 语句 ， 其 他 语句 都 不 具有 返回 类 型 ， 类 似 于 一 条 
void 表达 式 语句 。 


8.4 Switch-case 语 人 名 


switch-case 语 句 是 C 语 言 中 第 二 种 选择 语句 ，switch-case 的 一 般 表 达 


形式 为 : 





switch ( 表达 式 ) 











这 里 ，switch《〈) 选择 语句 中 的 表达 式 应 该 具有 一 个 整数 类 型 ( 包 
括 字符 类 型 和 布尔 类 型 ) ， 而 不 能 是 其 他 类 型 ， 后 面 走 哪 条 case 分 文 就 
根据 该 表达 式 的 值 进行 选择 。 一 个 switch 语 句 块 {} 中 可 包含 多 条 case 标 
签 语句 。 每 个 case 标 签 语 句 的 表达 式 应 该 是 一 条 整数 凋 量 表达 式 ， 并 且 
在 一 个 switch 语 句 块 中 不 应 该 存在 包含 相同 整数 常量 的 任意 两 条 case 标 
签 语句 。 如 果 switch 中 的 表达 式 的 值 与 某 一 个 case 标 签 语句 中 的 常量 值 
相同 ， 那 么 就 执行 该 case 标 签 下 的 语句 。break 跳 转 语句 用 于 跳出 当前 整 
个 switch 语 句 块 而 不 继续 往 下 执行 。 在 switch 语 句 块 中 最 多 允许 存在 一 
条 default 标 签 语句 ， 表 示 当 switch 选 择 语句 中 的 表达 式 的 值 没 有 与 任 一 
case 标 签 语句 后 的 常量 表达 式 的 值 巨 配 时 ， 则 执行 default 标 签 后 的 语 
人 句 。 倘 大 switch 表 达 式 的 值 没 有 与 任 一 case 标 签 的 常量 表达 式 的 值 下 





配 ， 且 不 存在 default 标 签 ， 则 不 执行 整个 switch 语 句 块 中 的 内 容 。 


在 case 或 default 标 签 下 的 语句 中 不 能 声明 一 个 临时 对 象 ， 由 于 它 在 
整个 switch 语 句 块 的 作用 域内 ， 因 此 它 可 能 对 其 他 case 分 文 可 见 ， 但 它 
执行 到 该 分 文 时 ， 其 值 可 能 还 没有 被 正确 初始 化 。 因 此 ， 如 果 我 们 在 某 
一 case 分 文 下 要 表达 一 些 比较 复杂 的 语句 ， 则 必须 使 用 复合 语句 ， 即 加 
上 但， 在 介 中 可 声明 临时 对 象 。 


代码 清单 8-4 将 描述 switch-case 语 句 的 一 般 用 法 以 及 一 些 需 要 注意 的 
地 方 。 


代码 清单 8-4 Switch-case 语 名 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


int a 
int b 


10; 
0, 


// 这 里 对 a + 1 的 值 进行 判断 
switch(a + 1) 


// 如 果 表 达 式 a + 1 的 值 为 0， 则 执行 case 10 标 签 下 的 语句 















































case 10: 

b += a; // 执行 b += a 

break; // 跳出 整个 switch 语 句 块 
// 如 果 表 达 式 a + 1 的 值 为 11， 则 执行 case 11 标 签 下 的 语句 
case 11: 

b -= a; 

break; // 跳出 整个 switch 语 句 块 





} 
printf("b = %d\n", b); 
























































switch(a) 
case 10: 
b = 0; // 这 里 没有 break 语 句 ， 因 此 当 执 行 完 case 106 下 的 所 有 语句 时 ， 
// 紧 接 着 还 会 执行 它 下面 的 case 12 下 的 语句 
case 12: 
b++; 
break; // 这 里 的 break 将 跳出 整个 switch 语 句 块 


























printf("b = %d\n", b); 


switch(b) 
case 0: 
a= 0; 
break; 


// 当 switch 选 择 语句 中 的 表达 式 b 的 值 
// 无 法 匹配 这 里 switch 语 句 块 中 所 有 的 case 常 量 表达 时 ， 
// 则 执行 defualt 标 签 语 句 下 的 语句 

defauilt: 


// 如 果 要 在 switch 语 句 块 中 的 任 一 标签 语句 下 声明 一 个 临时 对 象 ， 
// 则 必须 使 用 复合 语句 ， 即 用 { } 将 整个 上 下 文 包围 起 来 































































































int c = 10; 
a= 1; 
b=c+a; 
break; 


} 
} 
printf("a = %d, b = %d\n", a, b); 
switch(b) 
{ 


// 在 switch 语 句 块 中 可 以 放 其 他 表达 式 或 声明 对 象 ， 在 这 里 的 表达 式 都 不 会 被 执行 ， 
// 因为 Switch 语句 块 中 只 执行 匹配 switch 表 达 式 的 case 标 签 下 的 语句 

// 或 default 标 签 下 的 语句 。 因 此 不 建议 在 switch 语 句 块 中 使 用 除 case 或 

// default 标 签 语句 之 外 的 其 他 语句 
int c = 0; // 这 里 声明 了 switch 语 句 块 作用 域 的 对 象 c， 但 c 不 会 被 初始 化 为 9 
printf("c = %d\n", c); // 这 里 的 打印 语句 不 会 被 执行 












































































































































case 1: 

default: 
c = 10; // 此 语句 在 这 里 是 合法 的 ， 
break; 




















Ba 








为 c 没 有 被 声明 在 case 或 default 标 签 下 











case 11: 
CE 2 
a += C; 
b -= c; 
break; 


} 
printf("a = %d, b = %d\n", a, b); 


// 空 sSwitch 选 择 语 句 
switch(a); 





switch(a) 


// case 标 签 下 的 空 语句 
case 0: 


了 


// default 标 签 下 的 空 语句 
default: 


和 





正如 各 位 在 代码 清单 8-4 中 所 见 ，switch-case 的 用 法 非常 灵活 ， 但 也 


充满 了 各 种 限制 。 这 里 建议 各 位 使 用 一 些 常 规 的 用 法 ， 避 免 在 switch 语 
句 块 作用 域 下 声明 临时 对 象 ， 更 不 要 在 非 case 标 签 语句 下 使 用 任何 表达 
EW 


以 上 就 介绍 完了 C 语 言 中 的 所 有 选择 语句 ， 下 面 我 们 将 开始 介绍 C 
语言 中 用 于 表示 循环 执行 的 迭代 语句 ， 包 括 while、do-while 和 for 语 句 。 


8.5 ”while 与 do-while 迭 代 语 名 


C 语 言 中 ， 如 果 我 们 想 要 循环 迭代 地 执行 一 系列 语句 ， 那 么 我 们 惑 
要 用 到 迭代 语句 。 我 们 本 小 节 将 先 来 介绍 while 与 do-while 迭 代 语 句 。 


while 语 句 的 一 般 表达 形式 为 : 





while ( 表达 式 ) 语句 ; 





表示 如 果 表 达 式 的 值 为 真 ， 那 么 执行 语句 ， 等 到 语句 执行 完 之 后 ， 
再 去 判断 表达 式 的 值 ， 直 到 表达 式 的 值 为 假 时 跳出 当前 循环 。 图 8-2 展 
示 了 while 迭 代 语 句 的 执行 流程 。 





while 表 达 式 
是 否 为 真 





图 8-2 ”while 友 代 语 句 的 执行 流程 


图 8-2 简 单 明 了 地 展示 了 while 和 迭代 语句 的 整个 执行 流程 。 当 进入 
while 语 句 之 后 就 开始 判断 其 表达 式 是 人 否 为 真 ， 如 果 为 芮 ， 则 执行 其 循 
环 语句 〈 处 理 1) 。 执 行 完 处 理 1 之 后 再 立刻 回 到 while 表 达 式 处 继续 判 
断 ， 当 表达 式 的 值 为 假 时 才 跳 出 循环 执行 处 理 2。 


代码 清单 8-5 列 出 while 的 一 些 使 用 方法 以 及 一 些 注意 事项 。 


代码 清单 8-5” while 迭代 语句 的 使 用 





#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 


{ 
int a= 0, b= 10, c= 5; 


// 这 里 while 语 句 的 判别 条 件 为 c > 0， 也 就 是 说 ， 当 对 象 c 大 于 9 时 执行 while 语 句 块 
// 中 的 语句 ， 否 则 跳出 整个 while 循 环 语句 块 
while(c > 0) 
























































{ 

ad++' 

b--; 

Cc--; 

// 执行 完 上 面 三 条 语句 之 后 ， 再 次 回 到 while(c > 9) 处 
} 


// 当 c > 9 为 假 时 ， 跳 出 整个 while 循 环 语句 块 
printf("a = %d, b = %d, c = %d\n", a, b, c); 


// 这 里 使 用 true 表 示 while 人 迭代 语句 表达 式 总 是 为 真 。 这 里 就 是 通常 所 说 的 “无 限 循环 ” 












































while(true) 
{ 
at++， 
b--; 





























// 由 于 while 语 句 表 达 式 的 判别 条 件 总 是 为 真 ， 因 此 它 将 会 一 直 循 环 下 去 ， 
// 此 时 ， 我 们 可 以 通过 加 入 if 选择 汉语 句 进行 判断 ， 
// 然后 使 用 break 跳 转 语句 来 跳出 整个 while 循 环 
if(b == 0) 

break; // 这 里 当 b == 0 为 真 时 ， 使 用 break 跳 出 整个 循环 























































































































} 
printf("a = %d, b = %d\n", a, b); 


while(c < 5) 
{ 




























































































a++， 
if(a == 11) 
{ 
// continue 跳 转 语句 用 于 while 循 环 语句 块 中 ， 
// 表示 直 安 跳 转 有 Whilei 吾 句 的 判别 表达 式 处 ， 而 不 执行 以 下 语句 。 
// 因此 这 里 当 a 的 值 为 11 时 ， 则 不 执行 下 面 两 句 ， 而 直接 继续 判断 c < 5 
continue; 
} 
b++ 
C++ 


} 
printf("a = %d, b = %d, c = %d\n", a, b, c); 


// 下 面 举 一 个 比较 实用 的 例子 ， 将 给 定 的 一 个 数组 中 的 元 素 进行 倒序 排序 
// 将 array 中 元 素 进行 倒序 排序 
int array[] = { 1, 2, 3, 4, 5 }; 


// 先 获取 数组 长 度 


int length = sizeof(array) / sizeof(array[0|]); 


// | 
过 
// 尖 判 师 当 前 索引 是 否 小 于 长 度 的 一 半 ， 如 果 小 于 长 度 的 一 半 则 执行 循环 
while(a < length / 2) 


// 交换 数组 首尾 两 个 元 素 

int temp = array[al; 

array[a]l = array[length - 1 - al; 
array[length - 1 - al = temp; 













































































// 索引 递增 


a++， 
} 


printf("array elements: "); 


// 我 们 这 里 再 使 用 循环 将 数组 array 中 的 元 素 打 印 出 来 


a= 0; 
while(a < 5) 



































printf("%d ", array[al); 
a++， 





} 
// 输出 一 个 换行 符 
puts(™"); 


// 一 条 空 while 语 名 
while(a > 100); 


// while 与 if 类 似 ， 后 面 可 跟 一 条 语句 
while(b > 0) 


3 


// 有 时 ， 我 们 为 了 能 将 某 些 语 句 每 次 都 能 放 在 循环 判断 之 前 执行 ， 
// 可 以 利用 逗号 表达 式 来 实现 这 个 效果 。 
// 这 里 每 次 执行 循环 欠 代 前 ， 先 执行 b+=2) a-=2;， 然 后 再 判断 c > 0 的 结果 
while(b += 2, a -= 2, c > 0) 






























































printf("a = %d, b = %d\n", a, b); 


c--; 





代码 清单 8-5 中 还 介绍 了 continue 与 break 这 两 种 跳 转 语句 在 while 循 
环 体 中 的 用 法 。continue 用 于 直接 跳 转 到 while 表 达 式 处 做 判别 执行 ， 
break 则 表示 跳出 当前 循环 体 。 


下 面 我 们 来 介绍 一 下 do-while 循 环 语句 。do-while 的 表达 形式 为 : 





0 语句 while ( 表达 式 ) ， 





do-while 与 while 十 分 类 似 ， 但 不 同 的 是 : do-while 先 执行 循环 逻 
辑 ， 然 后 再 通过 while 来 判断 当前 表达 式 的 真 假 情况 。 因 此 其 执行 流程 
就 如 图 8-3 所 示 。 





图 8-3 ”do-while 语 句 的 执行 流程 


图 8-3 中 ， 处 理 1 残 好 比 是 do{} 中 的 语句 块 ， 当 表达 式 为 真 时 ， 执 行 
流 直 接 跳 转 到 处 理 1 中 继续 迭代 执行 ， 直 到 while〈) 中 的 表达 式 的 结果 
为 假 ， 则 跳出 整个 循环 ， 顺 序 执行 循环 外 的 逻辑。 


代码 清单 8-6 描 述 了 do-while 的 使 用 方式 以 及 相应 的 一 些 特 性 。 


代码 清单 8-6 ”do-while 循 环 的 使 用 


#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 


int a= 0, b= 10, c= 5; 











// 这 里 使 用 do -while 循 环 
do 











// 以 下 三 句 话 必定 会 先 执 行 一 次 


























} 

while(a < 5);  // 然后 判断 a < 5 的 结果 ， 如 果 为 真 则 继续 执行 do 里 的 语句 
// 上 述 循环 一 共 执 行 了 5 次 

printf("a = %d, b = %d, c = %d\n", a, b, c); 


do 
{ 














// 在 do 语句 块 中 声明 的 对 象 ， 在 其 外 部 不 可 被 访问 


int tmp =a+ 1; 











a--, 
b += tmp; 
C--, 























} 
// 这 里 在 while 表 达 式 中 就 不 能 引用 tmp 对 象 
while(a > 1); 




















printf("a = %d, b = %d, c = %d\n", a, b, c); 


do 


{ 
b--; 








H 














// 在 do 语句 块 中 使 用 continue 则 直接 跳 转 到 while 表 达 式 处 ， 
// 而 不 执行 continue 之 后 的 语句 
if(b == 20) 

continue; 








a++， 























// 在 do 语句 块 中 使 用 break 效 果 与 while 语 句 块 相同 ， 都 是 跳出 当前 循环 体 
if(a == 5) 
break; 









































} 
while(c--，true);  // 这 里 同样 可 使 用 逗号 表达 式 


// 以 上 ，b- -执行 了 5 次 ， 而 a++ 与 c- - 则 执行 了 4 次 
printf("a = %d, b = %d, c = %d\n", a, b, c); 


// do 语句 与 if 语 句 类 似 ， 后 面 直接 跟 一 条 语句 
do 




















a--; 
while(a > 0); 




















// 空 的 do 语句 。 各 位 要 注意 的 是 ，do 语 句 后 面 必须 跟 while 语 句 
do; 























while(false) 5 
do 
{ 

a++， 


// 在 循环 内 还 可 藤 套 循环 
while(b > 10) 
{ 























// 这 里 的 break 语 名 仅仅 跳出 当前 的 while(b > 19) 循 环 ， 
// 而 不 是 外 部 的 do-while 循 环 
if(c == 10) 

break; 





} 
} 
while(a < 5); 


printf("a = %d, b = %d, c = %d\n", a, b, c); 





while 与 do-while 循 环 介 绍 完 了 ， 下 面 我 们 将 介绍 for 迭 代 语 句 。 


8.6 ”for 帮 代 语 人 句 


for 和 迭代 语句 的 表达 形式 为 : 


for ( 子 表达 式 1; 表 达 式 2; 表 达 式 3 ) 语句 





其 中 ， 子 表达 式 1 可 以 是 一 个 声明 ， 也 可 以 是 一 个 表达 式 。 如 果 它 
古 一 个 声明 ， 那 么 在 这 里 声明 的 对 象 可 在 整个 循环 体 中 访问 。 子 表达 式 
1 在 整个 循环 开始 时 执行 一 次 ， 后 续 的 过 代 都 不 会 被 执 行 。 表 达 式 2 是 一 
个 控制 表达 式 ， 用 于 判定 循环 执行 条 件 是 否 满足 ， 如 果 表 达 式 2 的 计算 
结果 为 真 ， 则 执行 循环 ， 人 否则 退出 当前 for 循 环 。 表 达 式 3 则 是 在 每 执行 
完 一 次 欠 代 之 后 执行 一 次 。 在 每 次 友 代 结束 后 ， 总 是 先 执行 表达 式 3， 
然后 再 执行 表达 式 2 判 断 是 否 继续 循环 ， 如 果 可 继续 循环 则 继续 执行 循 
环 语句 。 











这 里 ， 子 表达 式 1 与 表达 式 3 可 缺 省 。 如 果 表 达 式 2 缺 省 ， 那 么 循环 
条 件 总 是 为 真 。 





图 8-4 描 述 了 for 迭 代 语 句 的 执行 流程 。 


循环 外 语句 


图 8-4” for 语句 执行 流程 





下 面 我 们 将 通过 代码 清单 8-7 进 一 步 介绍 for 和 迭代 语句 的 使 用 方法 以 


及 一 些 细节 问题 。 


代码 清单 8-7 ”for 迭代 语句 的 使 用 





#include <stdio.h> 


int main(int argc, const char * argv[]) 


{ 
int a= 0, b=5, c= 10; 














// 这 里 for 里 的 子 表达 式 1 是 一 个 声明 ， 它 声明 了 对 象 i 并 初始 化 为 0; 

















// 表达 式 2 是 判断 的 值 是 否 小 于 5， 如 果 小 于 5 则 进行 循环 ， 否 则 跳出 循环 ; 



































// 这 里 声明 的 i 仅 对 当前 for 的 循环 语句 可 见 ， 对 循环 语句 外 部 的 作 | 











for(int i = 0; i < 5; i++) 
printf("i = %d\n", i), a+t++; 


// 上 述 循环 语句 a++; 被 执行 了 5 次 
printf("a = %d\n", a); 


] 域 不 可 见 。 
// 表达 式 3 是 i++; 在 每 次 迭代 时 ， 当 循环 语句 a++; 执 行 完毕 后 执行 一 


次 i++， 


i++ // 这 条 语句 错误 ， 标 识 符 i 在 当前 main 函 数 的 语句 块 作用 域内 不 可 见 ! 





























// 这 里 子 表达 式 1 是 一 个 表达 式 ， 它 将 0 赋值 给 对 象 a 


for(a = 0; a < b; af++) 


ee 
printf("b + c = %d\n", b + c); 














// 这 里 的 for 语 句 缺 省 子 表达 式 1 与 表达 式 3， 仅 存在 控制 表达 式 2 
for(; c < 10; 
{ 


a--, 
C++， 
printf("c = %d\n", c); 





























// 这 里 的 fori 看 句 中 缺 省 了 子 表达 式 1 与 表达 式 2， 因此 表达 式 2 条 件 一 直 为 


// 这 里 表达 式 3 为 : a == 3? puts("continue | : (void)9 


)9 
// 表示 当 a 等 于 3 时 ， 执行 输出 命令 ， 否则 不 做 任何 事情 ，(void)9 是 一 条 void 表达 式 ， 
// 这 里 表示 不 做 任何 动作 ， 相 当 于 一 条 空 语 句 


for(; ; a == 3? puts("continue reached!") : (void)0) 
























































a++， 





// 当 a 等 于 3 时 执行 continue 语 句 ， 从 而 跳 过 之 后 的 语句 重新 跳 转 到 for 的 表达 式 3， 
// 然后 再 判定 表达 式 2 的 结果 (这 里 一 站 为 true) 
if(a == 3) 

continue; 











b++; 


if(b == 10) 
break; // 当 b 等 于 10 时 ， 跳 出 整个 for 循 环 








printf("a+ b+c = %d\n", a+b+ oc); 


} 


// for 后 面 跟 空 语句 
for(a = 0, b = 0; a < 10; a++ b++); 




















printf("a = %d, b = %d\n", a, b); 





代码 清单 8-7 列 出 了 各 种 对 for 迭 代 语 句 的 用 法 。 这 里 需要 注意 的 
是 ， 当 在 for 循 环 体内 使 用 continue 跳 转 语句 时 ， 控 制 流 是 跳 转 到 表达 式 3 


的 位 置 ， 而 不 是 直接 去 做 表达 式 2 的 判定 。 等 表达 式 3 执 行 完 成 后 再 做 表 
达 式 2 的 判定 。 





8.7 ”goto 语 人 句 


在 C 语 言 中 ， 把 goto、continue、break、return 这 4 种 语句 统称 为 跳 转 
语句 (jump statements) 。continue 与 break 语 句 ， 我 们 之 前 在 讲述 switch 
选择 语句 以 及 循环 语句 的 时 候 已 经 介绍 了 。continue 仅 用 于 循环 语句 
中 ， 在 while 与 do-while 中 表示 直接 跳 转 到 while 循 环 条 件 处 ;在 for 循 环 体 
中 表示 跳 转 到 表达 式 3 处 。 而 break 在 case 语 句 中 表示 退出 当前 switch 内 的 
执行 ， 用 在 循环 体内 表示 退出 当前 循环 执行 。retum 语 句 用 于 函数 返 


回 ， 我 们 将 在 下 一 章 进 行 介绍 。 本 节 主 要 介绍 goto 语 人 句 。 


goto 语 句 相 当 于 处 理 器 中 的 一 条 分 文 指令 “比如 jump、branch 
等 ) ， 这 条 语句 也 表征 了 C 语 言 与 计算 机 硬件 架构 非常 贴 合 。 尺 管 现代 
各 种 面 问 对 象 的 编程 语言 都 不 文 持 goto 语 句 ， 也 有 不 少 开 发 者 对 goto 语 
句 进 行 各 种 冷嘲热讽 ， 但 只 要 使 用 得 当 ，goto 确 实 也 是 一 个 非常 不 错 的 
编程 语法 工具 。 


C 语 言 中 要 使 用 goto 语 句 ， 后 面 必须 加 一 个 标签 名 〈lable) 。 我 们 
可 以 在 一 个 函数 中 几乎 任意 位 置 添加 一 个 标签 。 标 签 与 对 象 不 一 样 ， 当 
出 现 一 条 goto 语 名 时， 即便 goto 指 定 的 那个 标签 在 当前 goto 语 名 之 前 未 
曾 出 现 也 没关系 ，goto 人 允许 向 下 跳 转 。 正 因为 goto 语 句 十 分 灵活 ， 所 加 
的 限制 很 小 ， 所 以 也 很 有 可 能 会 出 现 一 些 问题 ， 比 如 跳 转 到 某 一 位 置 ， 





而 在 该 位 置 处 所 引用 到 的 对 象 未 被 初始 化 ， 这 就 可 能 产生 不 可 预期 的 运 
行 结果 。 因 此 我 们 在 使 用 goto 语 句 的 时 候 要 确保 当前 可 见 的 对 象 都 被 正 
确 初始 化 了 。 


代码 清单 8-8 展 示 了 goto 语 句 的 一 些 用 法 以 及 一 些 需 要 注意 的 地 方 。 


代码 清单 8-8 goto 语 句 的 使 用 





#include <stdio.h> 

int main(int argc, const char * argv[]) 
int a = 0; 
a++， 


了 


// 如 果 a 大 于 9， 则 跳 转 到 NEXT 标 签 后 的 语句 
if(a > 0) 
goto NEXT; 


// 这 里 的 a- - ;被 跳 过 执行 
a--; 




















NEXT: 
// 跳 转 到 此 循环 


for(int i = 0; i < 5; i++) 























a += i， 
// 如 果 a > 5， 则 跳出 此 循环 ， 到 NEXT2 标 签 后 面 的 语句 
if(a > 5) 
goto NEXT2; 

printf("a = %d\n", a); 

} 

NEXT2 : 
a++， 
int b = 10; 





// 如 果 a 与 b 的 和 大 于 20， 则 跳 转 到 NEXT 下 的 for 循 环 语句 处 
if(a + b < 20) 
goto NEXT; 


// 若 a > 0， 则 跳 转 到 NEXT3 标 签 后 的 语句 处 
if(a > 0) 

goto NEXT3; 
int c = 10; 


NEXT3: 

















// 这 里 要 注意 的 是 ， 如 果 跳 转 到 此 处 ， 之 前 对 对 象 c 的 初始 化 就 不 会 执行 ， 
// 所 以 此 时 c 的 值 是 不 确定 的 
printf("c = %d\n", c); 














goto FINISH ， 





FINISH: 
// et 
// 这 里 用 一 个 空 语句 (分 号 ) 来 表示 


F 






































} 





代码 清单 8-8 列 出 了 各 种 对 goto 语 句 的 使 用 方式 ， 包 括 癌 前 跳 转 和 癌 
后 跳 转 ， 从 循环 语句 中 跳出 ， 等 等 。 另 外 ， 还 展示 了 一 次 跳 转 可 能 会 引 
发 对 象 值 不 确定 的 情况 。 各 位 在 使 用 goto 时 应 当 注 意 这 些 问 题 。 


另外 ， 为 了 编写 一 个 结构 良好 的 代码 ， 在 很 多 时 候 我 们 都 避免 使 用 
goto 语 句 。 下 面 我 们 列举 一 个 使 用 do-while 语 名 来 实现 类 似 goto 语 句 效果 
的 代码 ， 如 代码 清单 8-9 所 示 。 


代码 清单 8-9 ”可 丛 代 goto 语 句 的 代码 示例 





#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char * argv[]) 





int a= 0, b=1,c= 2; 
// goto 语 句 效果 如 下 : 
If(a < 0 

goto FINISH ， 
printf("a = %d\n", a); 


if(b < 0) 
goto FINISH,; 


printf("b = %d\n", b); 


if(c < 0) 
goto FINISH ， 


printf("c = %d\n", c); 


FINISH: 


if(a<0 ||b<0 ||c < 0) 
puts("Error"); 


// 使 用 do-while 来 实现 上 述 代码 效果 : 
do 


if(a < 0) 
break; 


printf("a = %d\n", a); 


if(b < 0) 
break; 


printf("b = %d\n", b); 


if(c < 0) 
break; 


printf("c = %d\n", c); 
while(false); 


if(a<0 ||b<0 ||c < 0) 
puts("Error"); 





代码 清单 8-9 列 举 了 常用 错误 处 理 的 方法 。 我 们 看 到 ，if 语 句 与 goto 
语句 联 用 能 比较 方便 地 处 理 因 某 些 参 数 错 误 而 需要 进一步 处 理 的 逻辑 。 
然而 ， 我 们 有 时 也 可 以 用 do-while 同 样 简 尘 地 表达 这 一 逻辑 。 当 然 ， 如 
果 是 在 多 层 睦 套 的 循环 中 要 跳 转 出 整个 循环 ， 这 时 还 不 如 goto 来 得 直 
接 。 根 据 当 前 上 下 文 我 们 可 以 选择 比较 得 体 的 解决 方案 ， 同 时 这 里 也 建 
议 尽 量 避 免 使 用 goto 语 句 ， 但 如 果 需 要 花 很 大 力气 、 写 不 少 元 余 代码 才 
能 避免 goto 的 话 ， 有 时 还 不 如 直接 用 goto 来 得 更 体面 一 些 。 








8.8 ”本章 小 结 


本 章 介 绍 了 C 语 言 中 所 有 的 控制 流 语句 ， 包 括 选 择 语 句 、 循 环 语句 
以 及 跳 转 语句 return 语句 将 放 在 下 一 半 详 细 摘 述 ) 。 这 些 通常 也 是 一 
个 计算 机 程序 的 执行 顺序 控制 模式 。 当 然 ， 对 于 计算 机 处 理 器 的 执行 而 
言 ， 它 往往 只 有 跳 转 指令 ， 而 结构 化 的 分 文 、 循 环 是 高 级 语言 对 机 器 执 
行 的 一 种 高 层 抽象 ， 使 得 高 级 语言 编写 的 程序 更 易 读 。 








下 一 半 ， 我 们 将 介绍 更 局 级 、 更 具 模 块 化 的 分 支 功能 一 一 函数 。 当 


各 位 把 函数 学 完 后 ， 整 个 C 语 言 的 语法 框架 就 掌握 得 差不多 了 。 

















第 9 章 ”C 语 言 的 函数 


我 们 在 第 8 对 介绍 了 C 语 言 中 几 种 基本 的 控制 流 语句 。 但 是 为 了 使 一 
个 C 语 言 程序 写 出 更 展 好 的 结构 化 、 模 块 化 的 代码 ， 我 们 需要 借助 函数 


(function) 。 





在 前 儿 个 半 市 中 我 们 在 不 少 示 例 代 码 中 调用 了 一 些 库 函数 ， 比 如 
memcpy、memset、printf 等 ， 它 们 都 完成 一 些 特定 的 功能 ， 比 如 
memcpy 古 将 一 个 源 数据 缓存 空间 中 指定 长 度 的 内 容 ( 字 节 ) 拷贝 到 目 
的 缓存 。 而 printf 的 功能 则 是 将 指定 的 字符 串 输 出 到 控制 台 。 因 此 在 C 语 
言 中 ， 一 个 函数 是 由 大 干 语句 构成 的 用 于 完成 一 系列 功能 的 代码 块 。 一 
个 函数 可 以 有 输入 也 可 以 有 输出 。 输 入 数据 通过 参数 传递 的 方式 从 函数 
调用 者 (function caller) 传 入 函数 内 ， 输 出 数据 则 是 由 函数 返回 给 其 调 
用 者 的 操作 计算 结果 。 


这 里 自然 而 然 地 引出 了 调用 者 与 被 调用 者 (callee〉 的 概念 。 所 谓 
调用 者 是 指 调用 某 一 函数 的 函数 ， 被 调用 者 则 是 当前 被 调用 的 函数 。 毕 
如 ， 我 们 在 main 函 数 中 调用 printf 函 数 ， 那 么 对 于 printf 函 数 而 言 ， 调 用 
者 就 是 main 函 数 ，printf 则 是 被 调用 者 ， 而 调用 该 printf 函 数 时 所 处 的 位 
置 则 称 为 函数 调用 点 (invoke point) 。 





函数 的 执行 与 其 他 控制 流 语句 不 同 ， 在 我 们 调用 一 个 函数 时 ， 当 被 


调用 函数 执行 完 自 己 的 逻辑 之 后 会 把 控制 交还 给 其 调用 者 继续 执行 。 该 


执行 流程 如 图 9-1 所 示 。 






程序 结束 


如 图 9-1 所 示 ， 程 序 一 开始 先进 入 main 函 数 执行 语句 1， 然 后 调用 函 
数 A， 在 执行 了 函数 A 之 后 将 控制 返回 给 main 函 数 ， 紧 接着 执行 main 函 
数 中 的 语句 2， 节 后 退出 当前 程序 。 


图 9-1 函数 的 执行 流程 


本 章 将 介绍 函数 的 声明 、 定 义 、 调 用 、 参 数 传递 ， 此 外 后 续 章 节 还 
会 介绍 指向 函数 的 指针 以 及 对 主 函 数 的 介 


9.1 函数 的 声明 与 定义 


C 语 言 中 ， 一 个 函数 由 返回 类 型 、 函 数 名 以 及 形式 参数 〈 简 称 形 
参 ) 列表 构成 。 在 C 语 言 标准 中 ， 又 把 函数 名 称 作为 函数 标志 〈function 
designator) 。 也 数 声明 以 如 下 形式 表示 : 
































可 类 型 函数 名 ( 形 参 列表 ) 


高 








形 参 列表 中 ， 每 个 形式 参数 (parameter) 用 逗号 分 隔 。 比 如 : int 
foo (inta，floatb) ; 这 就 是 一 个 函数 声明 。 该 声明 给 出 了 一 个 名 为 foo 
的 函数 ， 其 返回 类 型 为 int， 其 形 参 列表 为 (inta，floatb) ; 该 列表 声 
明了 函数 foo 珊 有 两 个 形 参 ， 第 一 个 形 参 为 int 类 型 ， 第 二 个 形 参 为 float 
类 型 。 如 果 一 个 函数 不 返回 任何 值 ， 那 么 其 返回 类 型 用 void 表示 。 如 采 
一 个 函数 不 含有 任何 形式 参数 ， 那 么 参数 列表 可 用 〈) 或 (void) 来 表 

。 本 书 偏向 使 用 (void)〉 来 表示 不 带 任 何 形 参 的 形 参 列表 ， 因 为 这 样 
鸡 数 声明 与 函数 调用 不 容易 被 搞 混 。 在 老式 的 C 语 言 编 译 器 中 ， 人 允许 缺 

函数 返回 类 型 ， 如 果 缺 省 ， 则 默认 函数 返回 类 型 为 int。 但 对 于 现代 C 

编译 器 而 言 ， 如 果 不 写 函 数 返 回 类 型 则 会 报 出 警告 ， 尺 管 也 会 将 该 

函数 的 返回 类 型 默认 作为 int 类 型 处 理 。 





J 


. 


函数 声明 给 出 了 该 函数 的 原型 (prototype) ， 一 个 函数 原型 能 
确定 该 函数 的 一 个 比较 完整 的 类 型 。 如 果 函 数 声明 不 作为 函数 定义 的 一 


部 分 ， 那 么 形 参 列表 中 的 形 参 可 含有 不 完整 类 型 的 形 参 ， 男 外 可 以 用 [*] 
来 表示 变 长 数组 类 型 ， 否 则 每 个 形 参 都 必须 是 完整 类 型 的 。 在 一 个 函数 
原型 中 ， 函 数 形 参 列表 中 每 个 形 参 的 标识 符 可 省 。 比 如 上 述 的 foo 函 数 
可 声明 为 : 





int foo ( int, f loat ); 





函数 定义 的 一 般 形式 为 : 











存储 类 说 明 符 可 大 省“ 返回 类 型 ”函数 名 ( 形 参 列表 ) 复合 语句 














在 函数 定义 中 ， 要 么 形 参 列表 中 的 每 个 形 参 类 型 必须 是 完整 类 型 ， 
要 么 形 参 列 表 为 空 列表 。 返 回 类 型 也 必须 是 完整 类 型 或 void 类 型 。 另 
外 ， 存 储 类 说 明 符 只 能 用 extern 或 static， 或 者 可 缺 省 。 如 果 缺 省 存储 类 
说 明 符 ， 则 默认 为 extern。extern 存 储 类 说 明 符 表 示 一 个 函数 具有 外 部 连 
接 ; static 存 储 类 说 明 符 表示 一 个 函数 具有 内 部 连接 。 人 存储 类 型 说 明 符 将 
在 第 11 章 详细 介绍 





下 面 我 们 将 通过 代码 清单 9-1 来 给 大 家 先 简单 介绍 一 下 函数 的 声明 
与 定义 的 具体 C 语 言 代码 。 


代码 清单 9-1 函数 的 声明 与 定义 





#include <stdio.h> 


// 这 里 声明 一 个 结构 体 类 型 MyStruct， 对 它 尚 未 定义 
struct MyStruct,; 




































































// 这 里 声明 了 个 函数 MYFunc， 它 具 有 静态 存储 类 ， 返 回 类 型 为 MyStruct， 
// 带 式 参 数 s， 其 类 型 为 MyStruct。MyStruct 这 里 为 不 完整 类 型 
static struct MyStruct MyFunc(struct MyStruct s); 


// 这 里 直接 定义 了 一 个 函数 Foo， 它 具有 外 部 存储 类 ， 返 回 类 型 为 void， 
// 并 且 其 形 参 列表 为 空 
void Foo(void) 





















































































































































puts("Hello, world!"); 

















// 这 里 定义 MyStruct 结 构 体 类 型 
struct MyStruct 

















{ 
int a; 
float b; 
7/ 
// 这 里 直接 声明 了 三 个 函数 ， 第 一 个 函数 是 int Func1(void); 














// 第 二 个 函数 是 int* Func2(int); 

// 第 三 个 函数 是 int (*Func3(void) )[3]; 即 返回 一 个 int(* )[3] 类 型 的 不 带 形 参 的 函数 。 
// 对 函数 声明 后 但 不 定义 ， 且 不 去 实际 引用 ， 也 不 会 存在 连接 时 错误 

int Funci(void), *Func2(int), (*Func3(void))[3]; 


































































































int main(int argc, const char * argv[]) 






































// 调用 Foo 函 数 
Foo( ); 
// 这 里 调用 MyFunc 函 数 ， 给 它 传 递 的 实际 参数 是 MyStructs 寺 构 体 的 一 个 复合 字面 量 ， 


















































// 然后 MyFunc 甩 返回 IWyStructl 吉 构 体 对 象 赋值 给 Ss 对 象 
Struct MyStruct s = MyFunc((struct MyStruct){10, 1.5f}); 
printf("s.a = %d, s.b = %f\n", s.a, Ss.b); 

} 


// 这 里 定义 函数 MyFunc， 这 里 MyStruct 已 经 是 完整 类 型 了 
static struct MyStruct MyFunc(struct MyStruct s) 





























return (struct MyStruct){ s.a + 10, s.b - 0.5f }; 





代码 清 蛙 9-1 中 我 们 看 到 先 声 明了 一 个 MyFunc， 然 后 定义 了 一 个 函 

数 Foo。 在 定义 函数 Foo 的 时 候 ， 其 原型 也 就 同时 给 出 了 。 因 此 在 main 函 

数 中 ， 我 们 可 以 分 别 调用 这 两 个 函数 。 如 果 在 某 一 函数 中 要 调用 另 一 个 
函数 ， 而 所 调 函数 的 原型 在 该 点 处 未 知 ， 那 么 编译 器 就 会 发 出 警告 。 





在 main 函 数 中 ， 当 执行 Foo () ; 这 条 语句 时 ， 就 是 对 Foo 函 数 进行 
调用 ， 此 时 控制 流 会 跳 转 到 Foo 函 数 中 的 代码 进行 执行 ， 同 时 会 保护 当 





前 上 下 文 。 等 Foo 函 数 都 执行 完 之 后 将 会 恢复 main 之 前 调用 处 的 上 下 
文 ， 然 后 把 控制 流 返 回 给 当前 的 main 函 数 ， 继 续 执 行 Foo () ; 之 后 的 
代码 。 然 后 调用 了 MyFunc 函 数 ，MyFunc 函 数 构造 了 一 个 临时 MyStruct 
结构 体 对 象 ， 将 该 对 象 初始 化 后 返回 出 去 。 在 main 函 数 中 的 调用 端 ， 我 
们 声明 了 一 个 MyStruct 结 构 体 对 象 ， 将 MyFunc 返 回 的 结构 体 对 象 对 它 
进行 初始 化 ， 这 样 s 的 成 员 a 被 初始 化 为 20， 成 员 b 被 初始 化 为 1.0f。 





9.2 ”函数 调用 与 实现 


9.1 节 主要 介绍 了 函数 的 声明 与 定义 ， 并 且 简 单 提 人 到 了 也 数 调用 形 
式 。 本 节 将 详细 介绍 函数 调用 及 其 实现 原理 。 





像 代 码 清单 9-1 中 main 函 数 里 的 Foo 〈) 这 一 表达 式 在 C 语 言 标 准 中 
称 为 函数 调用 表达 式 。 而 Foo 后 面 的 〈) 就 是 函数 调用 操作 符 〈function 
call operators )， 它 是 一 个 单 目 后 级 操作 符 ， 它 前 面 的 函数 标志 就 是 一 
个 后 级 表达 式 ， 作 为 其 操作 数 。 而 整个 函数 调用 表达 式 也 是 一 个 后 级 表 
达 式 ， 后 面 圆 括号 中 可 以 不 加 任何 东西 ， 也 可 以 添加 一 组 用 逗号 分 隔 的 
表达 式 ， 这 组 表达 式 也 称 为 指定 函数 实 参 的 表达 式 列 表 。 一 个 实 参 《〈 即 
实际 参数 ，actual argument， 简 称 argument) 可 以 是 任 一 完整 对 象 类 型 的 
表达 式 。 在 函数 调用 之 前 ， 所 有 实 参 都 要 完成 计算 ， 并 且 赋 值 给 对 应 形 
参 。 函 数 的 每 个 形 参 ， 在 该 函数 被 调用 时 都 需要 有 一 个 实 参与 之 对 应 。 
所 以 这 里 实 参与 形 参 的 概念 十 分 容易 区 分 : 实 参 是 属于 函数 调用 者 的 对 
象 ， 然 后 传递 给 函数 被 调 者 ， 而 形 参 是 属于 函数 被 调 者 的 。 











这 里 就 涉及 了 辆 括 写 出 现在 表达 式 中 的 所 有 各 类 情况 一 一 如 末 圆 括 
号 中 放 的 是 类 型 名 ， 那 么 此 时 圆 括号 扮演 的 投射 操作 符 的 角色 ， 如 果 圆 
括 写 中 是 一 个 表达 式 ， 并 且 前 面 含有 一 个 表示 函数 标志 的 表达 式 (包括 
指向 函数 的 指针 〉 ， 那 么 此 时 圆 括 号 扮演 的 是 函数 调用 操作 符 的 角色 ; 








如 果 圆 括号 中 存放 的 是 一 个 表达 式 ， 并 且 前 面 没有 表示 函数 标志 的 表达 
式 ， 那 么 此 时 圆 括号 扮 沉 的 融 是 圆 括号 操作 符 的 角色 。 


9.2.1 函数 调用 的 顺序 点 


这 里 各 位 要 注意 的 是 ， 在 对 函数 标志 “《〈 即 函数 名 ) 计算 与 对 实 参 计 
算 之 后 、 在 函数 实际 调用 之 前 ， 有 一 个 顺序 点 。 但 是 ，C 语 言 标准 没有 
说 函数 标志 的 计算 与 对 实 参 的 计算 之 间 有 顺序 点 ， 因 此 对 函数 标志 的 计 
算 与 对 实 参 的 计算 谁 先 谁 后 是 不 确定 的 。 下 面 用 代码 清单 9-2 来 举 一 个 
简单 的 例子 进行 说 明 。 





代码 清 蛙 9-2 ”函数 调用 过 程 中 的 顺序 点 





#include <stdio.h> 
static void Funci(int a) 


printf("f1i a = %d\n", a); 


static void Func2(int a) 


printf("f2 a = %d\n", a); 


static void Func3(int a, int b) 


printf("b - a = %d\n", b - a); 


int main(int argc, const char * argv[]) 


// 这 里 借助 一 个 指向 函数 指针 的 数组 对 象 来 表明 一 个 函数 标志 。 
// 这 样 ， 对 pFuncs [二] 作为 函数 标志 符 的 计算 就 能 体现 出 来 了 
void (*pFuncs[2])(int) = { &Funci, &Func2 }; 




















int i = 0; 


// 这 里 编译 器 会 发 出 警告 ， 因 为 pFuncs[i++] 的 计算 与 i 的 计算 是 未 确定 顺序 的 


pFuncs[i++] (i); 



































// 这 里 编译 器 会 发 出 警告 ， 因 为 pFuncs[i] 的 计算 与 ++i 的 计算 是 未 确定 顺序 的 
pFuncs[i](++i); 


// 这 里 编译 器 会 发 出 警告 ， 因 为 第 一 个 实 参 的 计算 与 第 二 个 实 参 的 计算 是 未 确定 顺序 的 
Func3(i++, 1i); 







































































代码 清单 9-2 引 入 了 将 在 9.8 节 中 介绍 的 指 加 函数 的 指针 语法 ， 这 里 
先 借助 一 下 用 来 表明 对 函数 标志 的 计算 顺序 问题 。 这 里 各 位 可 以 看 到 ， 
无 论 是 函数 标志 的 计算 还 是 实 参 列表 中 对 每 个 实 参 的 计算 ， 它 们 之 间 痢 
没有 顺序 点 。 








没有 顺序 点 有 何 好 处 ?现代 高 级 一 点 的 处 理 器 都 具有 超标 量 流水 线 
《superscalar pipeline) 以 及 无 序 执行 引擎 (out-of-order execution 
engine) ， 使 得 处 理 器 对 多 条 前 后 没有 依赖 关系 的 指令 进行 并 行 执行 ， 
这 也 被 称 为 指令 级 并 行 〈Instruction-Level Parallelism，ILP) 。 我 们 以 代 
码 清 单 9-2 为 基础 ， 写 一 条 pFuncs[i+1] (Ci-1) ; 函数 调用 表达 式 语 句 ， 
那么 汇编 指令 可 能 是 这 样 的 (基于 ARMv7 架 构 指 令 集 ) : 








ldr R1, =i; 

adr R12, pFuncs,; 

add R12, R12, R1, 1sl #2; 
sub RO, R1, #1; 

ldr R12, [R12, #4]; 

blx R12; 





第 1 条 指令 是 将 变量 i 的 内 容 读 取 到 R1 寄 存 器 中 ， 


第 >、3 条 指令 则 是 将 R12 寄存 器 指 同 pFuncs 数 组 的 第 i 个 元 素 的 地 


址 ; 


第 4 条 指令 是 将 i-1 的 值 作为 第 一 个 实 参 的 值 ; 


第 5 条 指令 则 完成 了 对 整个 pFuncs[i+1] 的 计算 ， 获 得 了 当前 要 调用 


的 函数 指针 的 值 ; 


第 6 条 指令 做 函数 调用 。 





这 里 ， 第 1、2 条 指令 没有 依赖 和 关系， 因此 可 并 行 执行 ， 第 3 条 指令 
因为 动用 了 寄存 器 移 位 操作 加 算术 操作 ， 本 里 比较 复杂 ， 因 此 一 般 无 法 
与 其 他 指令 做 并 行 执行 了 ; 第 4、 第 5 条 指令 之 间 也 不 存在 相互 依赖 ， 可 
并 行 执 行 。 由 此 我 们 可 以 看 到 ， 不 安插 顺序 点 对 于 现代 处 理 器 的 加 速 执 
行 而 言 是 非常 有 好 处 的 。 而 处 理 吉 在 做 诸如 函数 调用 等 分 文 指令 时 ， 目 
然 会 清算 之 前 相关 计算 的 副作用 《包括 对 函数 标志 的 计算 以 及 实 参 的 计 
算 ) 。 因 此 ， 我 们 在 涉及 不 指定 顺序 点 的 表达 式 语句 中 ， 不 要 在 整 条 语 
句 中 出 现 对 同一 对 象 做 产生 顺序 点 副作用 的 操作 《比如 目 增 、 目 减 操 
LD 














下 面 通过 代码 清单 9-3 对 代码 清单 9-2 进 行 改进 ， 来 说 明 如 何 避 免 代 
码 清 单 9-2 中 所 产生 的 警告 问题 。 


代码 清单 9-3 ”避免 产生 顺序 点 副作用 


#include <stdio.h> 
static void Funci(int a) 


printf("fi a = %d\n", a); 


static void Func2(int a) 


printf("f2 a = %d\n", a); 


static void Func3(int a, int b) 


printf("b - a = %d\n", b - a); 


int main(int argc, const char * argv[]) 

void (*pFuncs[2])(int) = { &Funci, &Func2 }; 
int i = 0; 
pFuncs[i](i + 1); i++; 
pFuncs[i](i + 1); i++; 


Func3(i, i + 1); I++， 






































// 由 于 i 与 j 是 两 个 不 同 的 对 象 ， 因 此 这 里 不 会 引发 顺序 点 的 冲突 问题 


pFuncs[j++] (++i); 
pFuncs[j++] (++i); 


Func3(]jJ, ++1i); 





上 面 我 们 讲述 了 函数 调用 的 基本 形式 以 及 实 参 、 函 数 标 志 的 计算 与 
函数 调用 之 间 的 顺序 点 。 下 面 我 们 将 讲述 函数 调用 执行 的 细节 。 尽 管 C 
语言 标准 没有 规定 函数 执行 的 过 多 细节 ， 这 是 由 于 这 样 可 以 让 各 种 编译 
虱 针 对 当前 运行 环境 有 更 多 更 自由 灵活 的 实现 方式 ， 不 过 我 们 通过 对 孙 
数 内 部 执行 细 市 的 学 习 可 以 更 深入 透彻 地 理解 C 语 言 函 数 的 整个 概念 。 














正如 上 文 所 描述 的 ， 对 一 个 函数 的 调用 要 经 历 三 个 步骤 ， 前 两 个 步 
又 分 别 是 对 函数 标志 表达 式 的 计算 以 及 对 函数 实 参 的 计算 ， 这 两 步 之 间 
不 分 先后 顺序 ， 最 后 是 对 函数 进行 调用 。 把 实际 参数 传递 到 函数 形式 参 
数 的 实现 是 由 各 个 处 理 占 以 及 系统 环境 决定 的 ， 这 里 涉及 函数 调用 约 














定 ， 此 内 容 将 在 第 15 章 做 详细 介绍 。 


9.2.2 ”函数 的 栈 空间 


对 于 大 部 分 处 理 器 以 及 操作 系统 环境 而 言 ， 每 个 函数 都 具有 自己 独 
立 的 上 下 文 存储 空间 ， 此 存储 空间 往往 是 栈 式 存储 的 ， 所 以 又 被 称 为 栈 
Cstack) 空间 。 相 应 地 ， 一 般 处 理 器 会 有 一 个 专用 的 栈 指 针 寄 存 器 
CStack Pointer Register， 一 般 人 简称 为 SP〉 用 于 存放 当前 函数 所 属 的 栈 空 
间 的 地 址 。 初 始 时 ，SP 会 指向 进程 给 当前 程序 分 配 栈 空间 的 最 大 地 址 
处 。 然 后 我 们 在 函数 中 定义 一 个 局 部 对 象 ， 那 么 它 可 能 就 会 被 保存 在 当 
前 函数 的 栈 空间 中 ， 此 时 栈 指针 SP 会 先 减 该 局 部 对 象 所 占 存 储 空间 的 字 
节 大 小 ， 然 后 将 该 对 象 的 内 容 存放 在 此 存储 单元 内 。 我 们 观察 一 下 代码 
清单 9-4 所 列 出 的 main 函 数 在 执行 代码 的 过 程 中 对 栈 指针 的 变化 。 

















代码 清单 9-4， 栈 指针 操作 大 概 示意 代码 





int main(void) 


int a = 10; // 相当 于 SP -= 4; [SP] = 10， 
a += 20; // 相当 于 reg = [Sp]; reg += 20; [SP] = reg; 


// 函数 返回 前 需要 恢复 栈 空间 ， pe ee 动 回收 
// 这 里 相当 于 : reg = [SP]; SP 
return as 





















































代码 清单 9-4 中 ， 注 释 里 写 的 是 处 理 器 的 部 分 汇编 指令 ， 其 中 [SP] 表 
示 访 问 SP 当 前 所 指 同 的 栈 空间 的 内 容 ，reg 表 示 某 个 寄存 器 。 上 述 代码 





假定 运行 在 32 位 系统 中 ， 一 个 int 类 型 的 对 象 所 占 的 存储 空间 为 4 个 字 

节 。 因 此 一 开始 SP-=4 表 示 SP 指 针 先 减 去 4 个 字 节 ， 然 后 [SP]=10 表 示 将 
常量 10 存 储 到 减 去 4 之 后 的 SP 所 指向 的 栈 空 间 。 而 这 两 条 指令 〈 即 SP- 
=4; [SP]=10) 又 被 称 为 压 栈 (push) 操作 ， 许 多 处 理 器 会 直接 用 PUSH 
中 令 助 记 符 来 表示 ， 比 如 可 以 把 这 两 条 指令 表示 为 一 条 指令 : PUSH 
10。 随 后 ， 在 做 a+=20; 时 ， 先 获取 将 当前 SP 所 指向 的 栈 空间 地 址 值 ， 
然后 读 取 该 地 址 中 所 存放 数据 的 值 (这 里 存放 的 是 对 象 a 的 值 ) 加 载 到 
寄存 器 reg 中 ， 再 将 该 寄存 器 的 值 加 上 20， 最 后 把 该 寄存 器 的 值 写 入 SP 
所 指 的 栈 空间 中 。 最 后 一 名 返回 语句 则 是 将 SP 所 指 的 栈 空间 地 址 中 存放 
的 值 加 载 到 reg 寄 存 器 中 用 于 返回 结果 ， 然 后 将 栈 指针 加 4， 即 恢复 函数 
调用 前 的 SP 的 位 置 。 这 一 过 程 又 称 为 出 栈 (pop) 操作 ， 许 多 处 理 器 会 
直接 使 用 POP 指令 助 记 符 来 表示 ， 比 如 可 以 把 最 后 两 条 指令 表示 为 : 
POP reg。 图 9-2 展 示 了 代码 清单 9-4 中 执行 main 函 数 时 的 SP 操作 过 程 。 








图 9-2 假 定 在 系统 调用 main 函 数 时 ，SP 栈 指针 指向 0x8000 地 址 ， 并 
且 将 从 0x7000 到 0x8000 这 4KB 存 储 空 间作 为 当前 进程 的 栈 空 间 。 当 执行 
了 int a=10; 这 条 语句 之 后 ， 相 当 于 将 常量 10 压 入 栈 ， 此 时 对 象 a 的 存储 
空间 可 看 作为 以 0x7FFC 作 为 起 始 地 址 ， 一 直到 0x7FFF， 这 4 字 节 的 存储 
单元 ， 所 以 对 象 a 的 地 址 〈&a) 就 是 0x7FFC。 最 后 执行 return a; 语句 之 
后 ， 先 将 对 象 a 的 值 加 载 到 用 于 返回 值 的 寄存 器 reg 中 ， 然 后 恢复 SP 到 初 
始 时 的 位 置 。 最 后 执行 RET 指 令 ， 将 被 调 函 数 所 保存 的 函数 调用 者 之 前 
所 执行 CALL 指 令 的 下 一 条 指令 的 地 址 作为 目标 指令 地 址 进行 跳 转 。 





| 古国 jw 
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执行 a+=20 之 后 执行 POP reg 之 后 


图 9-2 ”SP 栈 指针 操作 过 程 


9.2.3 ”函数 的 参数 传递 与 返回 


上 面 介绍 了 对 一 个 函数 中 局 部 对 象 的 操作 ， 并 且 初 步 描 述 了 处 理 器 

中 栈 指针 SP 的 工作 方式 。 而 在 调用 某 个 浮 数 时 ， 将 实际 参数 传递 给 被 调 

函数 的 形式 参数 时 ， 有 时 也 需要 对 栈 空间 进行 操作 ， 尤 其 是 对 于 寄存 器 

数量 不 多 的 处 理 器 。 一 般 会 将 被 调 函 数 的 形 参 所 在 的 栈 存储 空间 分 配 在 
调用 函数 的 栈 空间 区 域 中 ， 也 就 是 说 让 函数 调用 者 负责 将 实 参 内 容 压 





栈 ， 以 此 形式 给 被 调 函 数 的 形 参 赋值 。 倘 磊 被 调 函 数 要 返回 一 个 结构 体 
对 象 ， 以 至 于 无 法 将 返回 内 容 保存 在 一 个 寄存 器 内 ， 那 么 该 对 象 存 放 在 
被 调 函数 的 栈 空 间 中 ， 然 后 将 该 结构 体 对 象 的 首 地 址 放 在 结果 寄存 器 中 
返回 出 去 。 函 数 调用 者 需要 通过 SP 指针 将 被 调 函 数 押 返回 的 结构 体内 容 
拷贝 到 自己 的 栈 空间 中 去 。 





下 面 我 们 通过 代码 清单 9-5 大 人 致 介绍 一 下 在 函数 中 调用 为 一 个 函数 
时 ， 在 参数 传递 以 及 获取 返回 数据 时 ， 对 栈 指针 的 操作 。 


代码 清单 9-5 ”参数 传递 与 函数 返回 时 的 代码 示例 





#include <stdio.h> 

struct MyStruct 

{ ， ， 
int 工 ; 
float f; 

}; 

static struct MyStruct Foo(int a, float b) 
Struct MyStruct s = {a, b } 


Ss.i += 10; 
s.f -= 0.5f; 


return s; 


int main(int argc, const char * argv[]) 
Struct MyStruct s = Foo(10, 1.5f); 


printf("s.i = %d, s.f = %f\n", s.i, Ss.f); 





代码 清单 9-5 中 ， 在 main 函 数 中 先 用 实际 参数 10 与 1.5f 来 调用 函数 
Foo， 然 后 将 函数 Foo 所 返回 的 MyStruct 类 型 的 对 象 给 main 函 数 中 声明 的 
局 部 对 象 $ 进 行 初 始 化 。 这 里 ，main 函 数 称 为 函数 调用 者 (caller) ， 而 


Foo 函 数 则 被 称 为 函数 被 调用 者 〈callee) 。EFoo 的 形 参 都 位 于 main 函 数 
的 栈 空间 范围 内 ， 图 9-3 展 示 了 在 main 函 数 中 调用 Foo 函 数 前 后 栈 指针 的 
有 化 





0x8000 0x8000 0x8000 
留 给 s.f 留 给 s.f 

Ox7FFC Ox7FFC Ox7FFC 
于 29S.1 

0x7FF8 





Ox7FFS8 Ox7FFS8 
Ox7FF4 Ox7FF4 Ox7FF4 
Ox7FFO Ox7FFO Ox7FFO 
Ox7FEC Ox7FEC Ox7FEC 
Ox7FES8 Ox7FES8 Ox7FES8 
进入 main 函 数 后 调用 Foo 函 数 前 传递 参数 
Ox8000 0x8000 Ox8000 
留 给 s.f 
Ox7FFC Ox7FFC Ox7FFC 
Ox7FF8 Ox7FF8 Ox7FF8 
Ox7FF4 Ox7FF4 Ox7FF4 
Ox7FFO 0x7FF0 0x7FF0 
Ox7FEC Ox7FEC Ox7FEC 
Ox7FES8 Ox7FES8 Ox7FES8 
调用 Foo 函 数 





Ox7FE4 Ox7FE4 
进入 Foo 罚 数 之 后 Foo 国 数 返 回 之 后 


图 9-3 ”函数 调用 时 的 参数 传递 与 返回 结果 的 获取 


图 9-3 中 ， 在 进入 main 之 前 ， 栈 指针 SP 假定 指向 0x8000 这 个 地 址 。 
进入 main 之 后 ， 假 定 SP 指针 移动 到 了 0x7FF8 的 位 置 ， 这 是 为 了 给 main 
函数 中 的 局 部 对 象 s 留 出 存储 空间 。 也 就 是 说 对 象 s 的 起 始 地 址 即 为 
0x7FF8。 当 开始 调用 Foo 函 数 时 ， 移 将 实 参 10 和 1.5{ 传 递 给 Foo 函 数 的 形 
参 a 和 b， 此 时 ， 先 压 入 形 参 b 的 值 ， 再 压 入 形 参 a 的 值 ， 形 参 a 的 地 址 自 
然 束 比 形 参 b 要 低 了 。 此 时 ， 形 参 a 的 地 址 为 0x7FF0， 形 参 b 的 地 址 为 
0x7FF4。 传 递 完 参 数 后 ， 开 始 调用 函数 Foo。 关 于 函数 调用 ， 有 些 处 理 


器 《〈 比 如 x86) 是 将 函数 调用 指令 的 下 一 条 指令 的 地 址 自动 压 栈 ， 而 有 
些 处 理 器 〈 比 如 ARM) 则 是 有 专门 的 连接 寄存 器 (link register) 用 于 存 
放 函 数 调用 指令 的 下 一 条 指令 地 址 。 这 里 假定 我 们 用 的 是 类 似 x86 处 理 
器 那 种 ， 将 返回 地 址 做 压 栈 操作 的 。 进 入 Foo 函 数 后 ， 跟 main 函 数 类 
似 ， 再 将 SP 栈 指针 减 8， 留 给 Foo 函 数 中 的 局 部 对 象 s。 这 样 对 象 s 的 起 始 
地 址 融 是 0x7FE4。 此 时 ， 我 们 从 图 中 可 以 观察 到 ， 从 栈 衬 间 地 址 
0x7FF0 到 0x7FFF 这 段 存储 空间 是 属于 函数 调用 者 main 函 数 的 区 域 ， 而 
栈 空间 地 址 0x7FE4 到 0x7FEF 这 段 存 储 空 间 是 属于 被 调 者 Foo 函 数 的 区 
域 。 当 Foo 函 数 返回 之 后 ，SP 栈 指针 回 到 0x7FF0 处 。 此 时 ， 编 译 器 会 自 
动 生成 代码 ， 将 Foo 函 数 中 所 返回 的 的 局 部 对 象 s〈 地 址 在 0x7FE4 处 ) 的 
首 地 址 通过 寄存 器 返回 给 函数 调用 者 main， 然 后 在 main 函 数 中 将 获得 的 
Foo 所 返回 的 局 部 对 象 s 的 内 容 拷贝 到 它 自 己 的 局 部 对 象 s 中 地址 在 
0x7FF8 处 ) 。 在 没有 调用 另 一 个 函数 之 前 ， 所 有 之 前 调用 过 的 函数 所 留 
在 栈 空 间 中 的 数据 都 会 被 保留 ， 这 样 有 助 于 做 返回 值 的 拷贝 。 但 是 当 执 
行 完 main 函 数 中 的 struct MyStruct s=Foo (10，1.5f) ; 这 条 语句 之 后 ， 
我 们 就 应 该 认为 之 前 所 调用 的 Foo 函 数 在 栈 空间 留 下 的 任何 数据 都 已 经 
无 效 了 。 此 后 ， 栈 指针 SP 会 恢复 到 0x7FF8， 即 把 之 前 压 入 的 形 参 对 象 
销毁 ” 掉 。 











一 条 语句 是 调用 库 函 数 printf， 此 时 与 调用 Foo 函 数 类 似 ， 会 对 栈 
指针 进行 操作 ， 先 做 参数 传递 ， 然 后 调用 printf 函 数 。 在 调用 printf 函 数 
过 程 中 ， 之 前 Foo 函 数 所 留 在 栈 空 间 的 数据 都 会 被 printf 函 数 所 留 下 的 数 





据 给 履 兰 掉 。 也 就 是 说 ， 一 个 系统 进程 的 整个 栈 空间 都 是 该 进程 中 所 有 
被 调 函 数 共享 的 。 因 此 ， 栈 空间 是 一 个 可 活动 的 、 可 复 用 的 、 用 于 存放 
函数 中 临时 产生 数据 的 存储 空间 。 


以 上 便 描 述 了 调用 一 个 函数 后 编译 圳 以 及 处 理 韦 大 概 会 做 的 一 些 事 
情 。 看 到 这 里 ， 相 信 读 者 应 该 对 栈 这 个 概念 有 所 了 解 了 ， 并 且 对 函数 内 
定义 的 局 部 对 象 的 生命 周期 也 有 了 大 概 的 认识 。 那 么 说 到 这 儿 我 们 应 该 
知道 ， 被 调 函 数 的 形 参与 调用 者 的 实 参 其 实 是 两 个 不 同 的 对 象 。 函 数 调 
用 者 的 实 参 在 目 己 的 栈 空 间 内 ， 而 在 传递 给 被 调 函 数 时 ， 是 将 保存 在 目 
己 栈 空 间 的 对 象 做 压 栈 处 理 ， 找 贝 到 被 调 函 数 可 访问 的 栈 空间 区 域 ， 尽 
管 这 部 分 区 域 仍然 属于 函数 调用 者 。 为 了 更 清晰 地 表达 这 一 点 ， 我 们 将 
通过 代码 清单 9-6 进 行 陈述 


代码 清单 9-6 ”呈现 被 调 函 数 形 参与 调用 者 的 实 参 属于 不 同 对 象 





#include <stdio.h> 
static void Foo(int a) 


// 这 里 将 输出 : a address is: 00007FFF5FBFF7EC 
printf("a address is: %.16tX\n", (uintptr_t)e&a); 





a += 10; 











// 这 里 将 输出 : a = 110 
printf("a = %d\n", a); 





} 
int main(int argc, const char * argv[]) 
{ 

int x = 100; 











// 这 里 将 输出 : x address is: 00007FFF5FBFF80C 
printf("x address is: %.16tX\n", (uintptr_t)e&x); 





Foo(x); 











// 这 里 将 输出 : x = 100 





printf("x = %d\n", x); 





过 代码 清单 9-6 我 们 可 以 发 现 ，main 函 数 中 将 其 局 部 对 象 x 传 递 给 
Foo 函 数 的 形 参 ，x 的 地 址 为 0x 00007FFF5FBFF80C， 而 Foo 形 参 a 的 地 址 
为 00007FFF5FBFF7EC， 两 者 属于 不 同 的 对 象 。 所 以 ， 即 便 在 Foo 函 数 
中 任意 修改 形 参 a 的 值 都 不 会 影响 main 函 数 中 x 对 象 的 值 。 





9.2.4 通过 形 参 修改 实 参 的 值 


那么 我 们 可 能 会 问 ， 如 何 通 过 函数 来 修改 函数 调用 者 对 象 的 值 呢 ? 
答案 很 简单 : 通过 指针 ! 如 果 我 们 将 函数 调用 者 的 茶 个 对 象 的 地 址 作为 
实 参 传递 给 被 调 函 数 的 形 参 (被 调 函 数 的 形 参 为 一 个 指针 类 型 的 对 
象 ) ， 那 么 在 被 调 函 数 中 可 利用 间接 操作 对 形 参 所 指 对 象 的 内 容 进 行 修 
改 。 代 码 清单 9-7 将 通过 实现 交换 两 个 整数 实 参 值 的 函数 来 描述 如 何 利 
用 指针 来 修改 实 参 值 。 


ny 


代码 清单 9-7 实现 交换 两 个 整数 对 象 值 的 函数 





#include <stdio.h> 
static void MySwapFunc(int *p, int *q) 
// temp 先 保存 参 p 所 指 对 象 的 值 


int temp = *p; 


// 将 形 参 q 所 指 对 象 的 值 赋 给 形 参 p 所 指 对 象 
“p= *q; 









































// 将 temp 保 存 的 值 赋 给 形 参 q 所 指 对 象 ， 这 样 正好 完成 了 整个 交换 操作 
*q = temp,; 
} 








int main(int argc, const char * argv[]) 


int a = 10, b = 20; 




















// 这 里 调用 MySwapFunc 时 ， 
/7 Se 象 a 的 地 址 与 对 象 b 的 地 址 作为 实 参 传递 给 MySwapFunc 函 数 
MySwapFunc(&a, &b); 


// 我 们 通过 打印 可 以 看 到 ， 对 象 a 的 值 与 b 的 值 两 者 被 交换 了 
printf("a = %d, b = %d\n", a, b); 





















































代码 清单 9-7 中 ， 通 过 将 main 函 数 中 的 局 部 对 象 a 与 b 的 地 址 作为 实 
参 传递 给 Foo 函 数 的 形 参 ， 然 后 由 Foo 函 数 通过 对 形 参 的 间接 操作 来 实现 
交换 两 个 函数 调用 者 对 象 的 目的 。 像 *p=*q; 这 条 语句 执行 完 之 后 ， 
main 函 数 中 的 对 象 a 的 值 就 变 为 了 20。 而 当 *q=temp; 这 条 语句 执行 完 
后 ，main 函 数 中 的 对 象 b 的 值 变 为 了 10。 


9.3 ”数组 类 型 作为 函数 形 参 


如 果 一 个 函数 的 形 参 是 一 个 数组 类 型 的 对 象 ， 那 么 它 会 被 调 整 为 指 
回 该 数组 元 素 类 型 的 指针 ， 同 时 如 宁 类 型 还 有 限定 符 《〈 比 如 const、 
volatile) ， 那 么 可 以 在 表示 数组 对 象 的 里 添加 。 如 果 在 口中 含有 static 
关键 字 ， 那 么 实 参 必 须 确 保 至 少 能 访问 该 形 参 所 指定 元 素 个 数 的 元 系数 


mr 半 





对 于 一 个 纯 函 数 声明 而 言 ( 即 声明 该 函数 之 后 不 下 接 对 它 定 义 》， 
形 参 可 以 具有 不 完整 类 型 ， 并 且 可 以 使 用 [*] 来 表示 变 长 数组 类 型 。 


代码 清单 9-8 将 描述 这 些 特 性 。 


代码 清单 9-8 数组 类 型 对 象 作 为 函数 形 参 





#include <stdio.h> 


// 这 里 是 对 函数 Func1 的 声明 ， 不 对 它 进行 寻 此 可 用 [*] 表 示 一 个 变 长 数组 类 型 。 
// 这 里 需要 注意 的 是 ，a 的 类 型 为 jnt[*]， 它 是 一 个 不 完整 类 型 
static void Funci(int a[*]); 































































































// 这 里 对 函数 Func1 进 行 了 定义 ， 这 里 不 能 使 用 [*]， 但 可 以 用 []。 
/7 Sd ee 而 int[] 是 完整 类 型 ， 
// 因为 int[] 会 被 自动 转换 为 jnt*。 ,函数 形 参 为 数组 类 型 时 ， 

/ 会 被 自动 转换 为 指向 该 数组 元 素 类 型 的 指针 ， 所 以 这 里 的 形 参 a 就 是 int* 类 型 


static void Funci(int a[]) 






















































































if(a != NULL) 
printf("a[0] = %d\n", a[0]); 

















// 这 里 sizeof(a) 的 大 小 就 相当 于 sizeof(int* ) 的 大 小 
printf("size of a = %zu\n", sizeof(a)); 


























当 一 个 数组 类 型 对 象 作为 函数 形 参 时 ， 无 论 指定 数组 长 度 是 多 少 都 不 会 
姑 为 它们 都 会 被 转换 为 指向 该 数组 元 素 类 型 的 指针 。 
// 这 里 的 形 参 a 也 是 int* 类 型 





// 















































static void Func2(int a[10]) 
{ 


if(a == NULL) 
puts("nil!"); 




















// 这 里 sizeof(a) 的 大 小 就 相当 于 sizeof(int* ) 的 大 小 
printf("size of a = %zu\n", sizeof(a)); 
































// 这 里 用 static 表 示 调 用 Func3 时 ， 实 参 所 指定 的 数组 或 缓存 应 该 至 少 含有 5 个 Int 元素 对 象 。 
// 这 里 加 上 const 限 定 符 ， 表 示 对 形 参 a 做 了 常量 限定 ， 3 不 能 指向 4 A 













































































// 因此 ， 这 里 a 的 类 型 为 jnt * const 
static void Func3(int a[static const 5]) 


{ 

















int sum = 0; 

// 对 数组 元 素 求 和 

for(int i = 0; i < 5; i++) 
sum += a[i]; 


// OK 
a[90] = 100; 


// 这 人 句 话 错误 : a = NULL;，a 不 能 指向 其 他 对 象 ， 即 a 的 值 不 能 被 修改 














} 


// 这 里 声明 Func4， 其 形 参 类 型 为 一 人 元 素 类 型 为 Int 的 二 维 数 组 ， 
// 中 a[ 半 ] 的 类 型 被 声明 为 int [* ]， 是 一 个 不 确定 个 数 的 数组 ， 
// 它 是 一 个 不 完整 类 型 


static void Func4(int a[static const 2][*]); 



















































































// 这 里 对 Func4 进 行 定义 ， al I a] 
// 对 于 一 个 函数 形 参 类 型 为 二 维 数 组 类 型 的 也 类 
// 这 里 a 的 类 型 会 被 动 转换 为 int(* is 的 [3 即 指向 int[3] 数 组 的 


static void Func4(int a[static const 2][3]) 































































































// 这 里 将 输出 sizeof(int[3] ) 一 样 的 大 小 
printf("size of a[0] = %zu\n", sizeof(*a)); 


// 将 a[1][2] 的 值 修改 为 20 
a[1][2] = 20; 


// 这 人 句 话 错误 : a = NULL;，a 的 值 不 能 被 修改 


int main(int argc, const char * argv[]) 


// 用 一 个 数组 字面 量 作为 实 参 来 调用 Func1 
Funci( (int[]){ 1, 2 }); 


// 这 里 直接 用 空 值 作为 形 参 来 调用 Func2 
Func2(NULL); 




















































































































int array[] = { 1, 2, 3, 4, 5, 6 }; 


// 将 数组 array 作 为 实 参 来 调用 Func3 
Func3(array); 


// array 的 第 一 个 元 素 被 修改 成 了 100 
printf("array[0] = %dxn"，array[90] )， 




















int darray[][3] = { 
1, 2, 3, 
4, 5, 6 

}; 


常量 指针 





Func4(darray); 


// darray[1][2] 的 值 被 修改 成 了 20 
printf("darray[1][2] = %d\n", darray[1][2]); 





代码 清单 9-8 涉 及 const 限 定 符 的 问题 ， 关 于 这 个 话题 我 们 将 在 第 12 
革 详 细 描 述 ， 这 里 仅 用 来 陈述 当 数 组 类 型 作为 函数 形 参 时 可 以 如 何 表 
达 。 


既然 我 们 知道 了 当 函 数 形 参 是 一 个 数组 类 型 时 ， 它 会 被 目 动 转 为 相 
应 的 指针 类 型 ， 也 就 是 次 我 们 不 能 将 一 个 数组 直接 以 元 素 找 贝 的 方式 传 
递 给 函数 形 参 ， 因 此 我 们 往往 以 一 个 数组 的 某 个 元 素 的 地 址 传递 给 航 调 
函数 的 形 参 ， 然 后 可 以 再 加 一 个 参数 表示 当前 提供 数组 的 长 度 。 代 码 清 
单 9-9 给 出 了 一 个 示例 代码 ， 里 面 实现 了 给 一 个 指定 数组 的 所 有 元 素 进 
行 倒 序 排列 的 函数 。 


代码 清单 9-9 对 指定 数组 进行 倒序 排列 的 函数 实现 





#include <stdio.h> 


pA 

* 这 里 定义 一 个 名 为 SwapArray 的 函数 ， a 
* @param a 指向 一 个 传 入 数组 元 素 的 地 址 ， 其 类 型 为 in 

* @param count 用 于 指定 传 入 数组 的 长 度 :本 元 素 涉 数 ; 

“7 
void SwapArray(int a[], int count) 

























































































// 这 里 只 需要 遍历 一 遍 长 度 
for(int i = 0; i < count / 2; i++) 


// 交换 数组 首尾 两 个 元 素 的 值 
int temp = = a[il]; 

a[i] = a[count - i - 1]; 
arcount - i - 1] = temp; 


} 



































} 


int main(int argc, const char * argv[]) 


int array[] = { 1, 2, 3, 4, 5 }; 


// 从 array 第 0 个 元 素 开始 ， 对 所 有 元 素 进行 倒序 排序 
SwapArray(array, 5); 


// 输出 排序 结 : 
printf("Elements: "); 
































for(int i = 0; i < 5; i++) 
printf("%d ", array[i]); 


puts(™"); 























// 再 从 array[1] 元 素 开始 ， 对 它 及 后 序 元 素 进 行 倒序 排序 
SwapArray(&array[1], 4); 


// 输出 排序 结果 
printf("Elements: "); 





for(int i = 0; i < 5; i++) 
printf("%d ", array[i]); 


pulaen)s 





通过 代码 清单 9-9， 我 们 对 如 何 将 数组 对 象 作 为 实 参 传递 给 被 调 函 
数 有 了 一 些 清 晰 的 思路 。 上 述 倒序 排序 数组 元 素 的 算法 也 十 分 简单 ， 即 
将 数组 第 一 个 元 系 与 最 后 一 个 元 素 进行 交换 ， 第 二 个 元 素 与 倒数 第 二 个 
元 素 进行 交换 ， 以 此 类 推 ， 最 后 一 直到 中 间 那 个 元 和 水， 这 样 整个 数组 的 
元 素 束 被 倒序 排序 了 一 过 。 














9.4 市 有 不 定 参 数 关 型 及 个 数 的 函数 声明 与 调用 


VD 


C 语 言 冰 数 的 形 参 类 型 列表 的 最 后 可 以 市 有 不 定 参 数 类 型 及 个 数 的 
形 参 列表 ， 用 (，...) 来 表示 。C 语 言 标准 明确 规定 ， 含 有 不 定 参 数 个 
数 的 形 参 列表 中 ， 必 须要 有 一 个 确定 的 命名 形 参 ， 并 且 .… 后 不 能 再 跟 其 
他 形 参 。 比 如 以 下 函数 声明 是 错误 的 : 








// 错误 ! 在 ..， 之 前 必须 至 少 要 有 一 个 命名 形 参 
void Funci(...); 


























// 错误 ! 在 ..， 之 后 不 能 再 跟 任何 形 参 
void Func2(int a, ..., int b); 








对 于 调用 带 有 不 定 参数 个 数 的 函数 时 所 要 传递 的 实 参 而 言 ， 由 于 不 
定 参数 列表 中 的 每 个 参数 类 型 不 确定 ， 因 此 C 语 言 编译 器 将 采用 默认 的 
实 参 晋 升 (argument promotion) 机 制 。 也 就 是 说 ， 对 于 任何 整数 转换 等 
级 小 于 int 类 型 的 实 参 ， 其 类 型 都 将 被 晋升 为 int 类 型 ， 单 精度 浮 点 类 型 
(float〉 的 实 参 将 被 晋升 为 双 精 度 浮 点 类 型 《double) 。 





另外 ， 当 我 们 要 实现 一 个 带 有 不 定 参数 个 数 的 函数 时 ， 需 要 借助 
<stdarg.h> 标 准 头 文件 中 的 宏 来 欠 代 获取 每 个 形 参 。<stdarg.h> 标 准 头 文 
件 定 义 了 4 个 宏 用 于 明 历 传 入 的 实 参 列 表 。 正 如 上 面 所 述 ， 带 有 不 定 实 
参 个 数 及 类 型 的 函数 的 形 参 列表 中 ， 至 少 会 有 一 个 形 参 〈 即 最 开始 的 命 
名 形 参 ) ， 所 以 在 ... 之 前 的 那个 形 参 在 实 参 访问 机 制 中 将 扮演 一 个 特殊 





的 角色 。 


<stdarg.h> 标 准 头 文件 中 定义 的 va_list 类 型 是 一 个 完整 类 型 ， 用 来 保 
存 va_start、va_arg、va_end 以 及 va_copy 这 4 个 宏 函 数 在 操作 过 程 中 所 需 
要 的 状态 信息 ， 我 们 通常 会 在 获取 不 定 实 参 列 表 之 前 先 用 va_list 类 型 来 
声明 一 个 对 象 。 我 们 也 能 将 va_list 声 明 的 实 参 传递 给 为 一 个 函数 ， 如 果 
它 的 最 后 一 个 形 参 为 va_list 类 型 的 话 。 为 了 叙述 方便 ， 我 们 假定 这 里 声 
明了 一 个 va_list 对 象 ， 名 为 ap。 然 后 下 面 对 4 个 宏 函 数 的 介绍 中 都 用 ap 作 
为 va_list 声 明 的 对 象 。 








在 开始 访问 ... 所 对 应 的 实 参 之 前 ， 必 须 先 调用 va_start 宏 。va_start 对 
ap 进 行 初始 化 ， 这 样 ap 才 能 后 续 为 va_arg、va_end 等 宏 所 使 用 。 这 里 大 
家 需要 注意 的 是 ， 对 于 同一 个 不 定 参数 类 型 与 个 数 的 参数 列表 而 言 ， 
va_start 只 能 被 调用 一 次 。va_start 的 第 二 个 参数 需要 传 ，... 之 前 的 那个 形 


参 对 象 ， 以 定位 不 定 参 数列 表 从 哪个 命名 参数 开始 起 获取 。 


va_arg 宏 扩展 为 一 个 表达 式 ， 用 于 指定 在 函数 调用 中 下 一 个 实 参 的 
类 型 与 值 。va_arg 宏 的 第 一 个 参数 为 ap， 在 每 执行 一 次 va_arg 时 ，ap 会 
被 目 动 修改 为 下 一 个 实 参 的 值 ， 然 后 返回 。 因 此 ，va_arg 返 回 的 是 当前 
ap 所 指定 的 下 一 个 实 参 的 值 ， 同 时 ap 也 会 指定 到 下 一 个 实 参 位 置 。 第 二 
个 形 参 应 该 是 一 个 类 型 名 ， 该 类 型 名 与 调用 者 传 入 的 实 参 类 型 对 应 。 这 
里 各 位 要 注意 的 是 ， 由 于 调用 者 传 入 的 实 参 会 做 默认 的 实 参 普 升 ， 所 以 


va_arg 的 第 二 个 参数 不 能 是 char、_Bool、short 等 低 于 int 类 型 转换 等 级 的 





整数 类 型 ， 如 果实 参 传 入 的 是 这 些 类 型 的 对 象 ， 那 么 这 些 对 象 会 被 自动 
晋升 为 int 类 型 。 因 此 要 获取 char、short 等 类 型 实 参 时 ， 都 要 用 

va_arg (ap，int) 。 如 果实 参 传 入 的 是 float 类 型 对 象 ， 那 么 会 被 自动 晋 
升 为 double 类 型 。 


当 获 取 完 不 定 参数 列表 后 ， 调 用 va_end 宏 来 无 效 化 ap， 这 样 ap 之 后 
就 不 可 再 使 用 了 。 


va_copy 宏 初始 化 其 第 一 个 参数 dest 作 为 其 第 二 个 参数 src 的 一 个 找 
贝 ， 两 者 都 是 va_list 类 型 的 对 象 。 如 果 src 对 象 已 经 通过 va_start 进 行 了 初 
始 化 ， 并 且 通 过 几 次 va_arg 的 迭代 ， 那 么 这 束 好 比 完 对 dest 调 用 了 
va_start 宏 ， 然 后 迭代 地 调用 va_arg 宏 ， 直 到 dest 的 状态 与 src 的 状态 相 
同 。 


代码 清单 9-10 将 给 出 定义 与 调用 不 带 参 数 个 数 的 函数 的 方法 以 及 使 
用 这 些 宏 的 详细 方法 。 


代码 清单 9-10 不 带 参 数 个 数 及 类 型 的 函数 的 定义 与 调用 





#include <stdio.h> 
#include <stdarg.h> 












































// 定义 一 个 含有 一 个 int 形 参 ， 再 跟 一 个 不 定 参数 类 型 及 个 数 的 形 参 列 表 
static void Mytest1(int n, ...) 


{ 











// 首先 声明 va_1ist 类 型 的 对 象 ap 
va_list ap; 


// 对 ap 初始 化 ， 并 指明 形 参 n 是 紧 跟 在 ..， 之 前 的 形 参 
va_start(ap, n); 

// 开始 获取 第 一 个 实 参 ， 其 类 型 为 int 

int a = va_arg(ap, int); 
































// 从 代 获 取 第 二 个 实 参 ， 其 类 型 为 unsigned 
unsigned b = va _arg(ap, unsigned); 




















// 和 迭代 获取 第 三 个 形 参 ， 其 类 型 为 doub1le 
double d = va_arg(ap，double); 


// 结束 迭代 ， 对 ap 无 效 化 处 理 
va_end(ap); 
































printf("result = %f\n", n +a+b +d); 
} 


// 这 里 定义 函数 MyFunc， 其 第 二 个 形 参 为 va_1ist 类 型 
static double MyFunc(int n, va_list ap) 




































































{ // 在 此 函数 中 ， 无 需 对 ap 做 va_start 初 始 化 以 及 va_end 的 无 效 化 
int a = va_arg(ap, int); 
unsigned b = va _arg(ap, unsigned); 
double d = va_arg(ap, double); 
return n+a+b+d; 

} 

static void MyTest2(int n, ...) 

t va_list ap; 
va_start(ap, n); 
// 这 里 将 初始 化 完 的 ap 对 象 作为 实 参 ， 传 递 给 MyFunc 
double result = MyFunc(n, ap); 
va_end(ap); 

。 printf("result = %f\n", result); 


struct MyStruct { int a, b; }; 
union MyUnion { char c; Short s; }; 


// 我 们 也 可 以 用 自 定义 类 型 作为 不 定 参 数 类 型 与 个 数 的 参数 列表 的 实 参 
static void MyTest3(int a, ...) 
{ 























Kaun 














va_list ap; 


va_start(ap, a); 














并 2 








// 这 里 指定 了 MyStruct 结 构 体 类 型 
Struct MyStruct s = va_arg(ap, struct MyStruct); 





// 尽管 un 的 大 小 为 2 个 字 节 ， 但 一 般 C 语 言 实现 都 会 对 它 做 默认 的 晋升 ， 
// 因此 这 里 指定 union MyUnion 也 没有 关系 

union MyUnion un = va_arg(ap, union MyUnion); 
printf("size of un: %zu\n", sizeof(un)); 


























va_end(ap); 


int result = a 
// 输出 : result 
printf("result 


SsS.a+ SsS.b - un.s; 
10 
%d\n", result); 





由 


} 


int main(int argc, const char * argv[]) 


int8_t a = 10; 
uint16 t b = 20; 


// 实 参 a 的 类 型 将 被 晋升 为 Int 

// 实 参 b 的 类 型 将 被 晋升 为 unsigned 
// 实 参 10 .5f 的 类 型 将 被 晋升 为 double 
Mytest1(3, a, b, 10.5f); 





























MyTest2(5, a, b, 10.5f); 


// 这 里 将 一 个 结构 体 对 象 与 一 个 联合 体 对 象 作为 不 定 参 数 的 实 参 传递 
MyTest3(10, (struct MyStruct) { 1, 2 }, (union MyUnion) { .s = 3 }); 























代码 清单 9-10 中 ，MyTest1 函 数 完 整地 通过 一 般 的 方式 来 获取 不 定 
参数 列表 部 分 的 实 参 ， 而 MyTest2 函 数 则 是 借助 MyFunc 来 获取 其 不 定 参 
数 个 数列 表 部 分 的 实 参 。 像 我 们 经 常 使 用 的 printf 函 数 就 是 一 个 典型 的 
带 有 不 定 参 数 个 数 与 类 型 的 库 函 数 。 该 函数 在 实现 中 通过 第 一 个 实 参 的 
字符 串 格式 符 来 解析 后 续 每 个 实 参 的 类 型 ， 从 而 可 以 恰当 地 获取 实 参 的 
值 : 








9.5 轴 数 的 递归 调用 





C 语 言 的 函数 调用 有 一 个 十 分 有 趣 的 特性 ， 就 是 可 递归 调用 。 什 么 
是 递归 调用 ?” 其 实在 我 们 中 学 数学 课 上 就 有 所 接触 了 。 比 如 ， 函 数 
f (x) =x*f (X-1) ， 我 们 称 f (x) 为 一 个 递 推 方程 。 如 果 把 它 映射 到 C 


语言 中 ， 那 么 函数 f(x) 就 是 递归 调用 的 ， 也 就 是 在 计算 这 个 函数 的 时 
候 借用 了 该 函数 本 身 。 


在 一 个 函数 中 的 某 个 位 置 调 用 该 函数 自己 ， 这 也 被 称 为 直接 递归 调 
用 。 如 果 函 数 A 在 某 个 位 置 调用 了 消 数 B， 而 函数 B 在 某 个 位 置 处 又 调用 
了 函数 A， 那 么 这 被 称 为 间接 递归 调用 。 


下 面 我 们 用 代码 清单 9-11 来 举 一 个 简单 的 例子 来 看 看 ， 函 数 递归 调 
用 是 如 何 执行 的 。 


代码 清单 9-11 函数 递归 调用 人 简介 





#include <stdio.h> 


static void Func(int n) 




















/7 dd 则 直接 返 下 
if(n 0) 


puts("last level!"); 
return; 




















// 打印 当前 形 参 n 的 值 ， 以 确定 现在 是 第 几 层 递归 调用 
printf("n = %d\n", n); 























// 递归 调用 Func， 并 且 将 n - 1 作为 实 参 传 入 
Func(n - 1); 


puts("call over"); 


int main(int argc, const char * argv[]) 


Func(3); 





代码 清单 9-11 中 定义 了 一 个 Func 函 数 ， 在 其 内 部 实现 中 它 做 了 递归 
调用 。 在 每 次 递归 调用 时 ， 都 会 先 重 新 进入 Func 函 数 ， 直 到 最 内 部 的 调 
用 返回 ， 然 后 从 里 到 外 逐个 进行 调用 返回 。 在 main 函 数 中 用 实 参 3 来 调 
用 Func 函 数 ， 因 此 最 后 输出 结果 是 : 





= es 汪 e> ， 
| | | 
POO 


Jast level! 
call over 
call over 
call over 





下 面 我 们 用 图 9-4 来 描述 调用 Func 函 数 之 后 的 整个 控制 流 的 执行 。 
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图 9-4 ”函数 递归 调用 的 执行 流程 


图 9-4 中 ， 和 矩形 方 框 中 的 内 容 表 示 当 前 函数 中 要 执行 打印 的 内 容 。 
我 们 通过 这 个 顺序 图 可 以 清晰 地 看 到 ， 当 函数 Func 做 好 归 调 用 时 ， 它 区 
把 执行 控制 权 直 接 交 给 了 新 的 被 调 的 Func， 只 有 等 最 后 被 调 的 Func 返 回 
之 后 ， 之 前 被 递归 调用 的 Func 才 能 再 获得 执行 权 继 续 执 行 。 我 们 看 到 调 
用 与 返回 非常 具有 层次 感 。 











下 面 ， 我 们 将 列举 寿 干 实例 来 进一步 说 明 递归 函数 的 使 用 方式 ， 以 


及 使 用 递归 函数 的 优 缺 点 。 


我 们 先 以 比较 简单 的 阶乘 算法 来 介绍 一 个 递归 函数 实现 的 具体 算法 


我 们 在 中 学 时 应 该 学 过 阶乘 的 表达 方式 ， 即 f Cn) =n* (n-1) 


* (n-2) *...*1。 而 如 果 当 n 为 O 时 ， 则 f (0〉=1。 所 以 这 可 以 用 简单 的 递 
推 式 来 表达 一 一 当 n==0 时 ，f (0) =1; 和 否则，f Cn) =nx (Cn-1) 。 而 这 
种 弟 推 形式 的 函数 表达 式 就 能 方便 地 用 C 语 言 代 码 来 表达 了 了。 代码 清 单 
9-12 展 示 了 阶乘 算法 的 递归 实现 与 循环 迭代 实现 两 种 方式 。 





代码 清单 9-12 ”阶乘 的 递归 实现 与 循环 迭代 实现 





#include <stdio.h> 


int 


int 


int 


FactorialRecursion(int n) 


if(n < 1) 
return 1; 


// 这 名 表达 式 语 句 正如 我 们 所 提 到 的 类 似 : f(n) = n * f(n - 1) 这 种 形式 


return n * FactorialRecursion(n - 1); 

















FactorialIteration(int ny) 


if(n < 1) 
return 1; 


for(int i =n- 1;i> 0; i--) 
n *= 工 


return n; 


main(int argc, const char * argv[]) 
int result = FactorialRecursion(5); 
printf("result = %d\n", result); 
result = FactorialIteration(5); 


printf("result = %d\n", result); 


i 


代码 清单 9-12 中 ， 第 1 个 函数 FactorialRecursion 用 的 是 以 递归 调用 的 
方法 实现 的 阶乘 计算 ， 第 2 个 函数 FactorialIteration 则 是 用 循环 迭代 的 方 
法 实现 的 阶乘 计算 。 从 表达 上 来 看 ， 我 们 可 以 很 明显 地 看 到 ， 采 用 递归 
的 方式 比 采 用 循环 的 方式 要 简洁 很 多 。 从 执行 效率 上 看 ， 由 于 每 次 做 递 
归 调 用 都 需要 做 当前 函数 的 上 下 文保 护 ， 所 以 难免 会 做 一 些 堆栈 操作 ; 
此 外 还 有 函数 调用 本 身 会 对 处 理 器 的 执行 流水 线 造成 一 定 影响 ， 因 此 运 
行 性 能 肯定 比 直接 循环 迭代 来 得 低 些 。 


通过 上 面 的 代码 清单 9-12， 我 们 能 看 到 ， 在 表达 上 递归 调用 形式 比 
循环 迭代 更 为 简洁 ， 而 在 运行 效率 上 则 是 循环 和 友 代 更 有 优势 。 在 这 种 单 
一 线性 数据 处 理 上 我 们 很 容易 使 用 循环 碗 代 来 代 丛 递归 调用 ;， 然 而 ， 如 
果 是 树 状 数据 处 理 顺 序 ， 那 么 用 循环 束 很 难 去 表达 了 。 这 个 时 候 我 们 更 
倾 问 于 直接 使 用 递归 调用 来 处 理 数 据 。 代 码 清单 9-13 将 为 大 家 呈现 更 为 
复杂 的 递归 函数 调用 方式 。 





代码 清单 9-13 ”更 复杂 些 的 函数 递归 调用 


#include <stdio.h> 
void ListNumber(int n) 
if(n > 9) 


printf("10\n"); 
return; 


} 
if(n < -9) 
printf("-10\n"); 


return; 


printf("%d ", n); 


ListNumber(n * 2); 
ListNumber(-n * 2); 
} 


int main(int argc, const char * argv[]) 


ListNumber(2); 





代码 清单 9-13 的 计算 输出 结果 为 : 








这 种 结果 输出 显然 难以 用 单纯 的 循环 迭代 来 表达 ， 因 为 它 是 一 种 树 
状 输出 。 我 们 通过 图 9-5 来 列 出 结果 输出 过 程 。 











[16) | If(-10)| (~10)| [f(-10) 上 EC-16) rae)| 1f(G16) If(-16)| 











图 9-5 ” 树 状 递归 执行 顺序 图 





图 9-5 中 ， 和 矩形 方 框 中 的 f 束 表示 代码 清单 9-13 中 的 ListNumber 也 | 
数 。 直 线 上 的 用 圆 括 号 包围 的 数字 表示 当前 调用 次 序 ， 比 如 (1) 表示 


第 1 次 重新 进入 ListrNumber 函 数 ，(5) 表示 在 第 5 次 重新 进入 ListNumber 
函数 。 显 然 ， 如 果 要 用 循环 迭代 来 表示 这 种 树 状 执行 次 序 将 会 十 分 复 
杂 。 所 以 ， 这 里 用 递归 形式 表达 不 仅 简 洁 ， 而 且 更 有 效率 。 


和 


最 后 ， 我 们 再 举 一 个 斐 波 那 契 数 列 的 例子 来 讲 一 下 函数 递归 调用 。 
斐 波 那 契 数列 指 的 是 这 么 一 个 数列 : 0，1，1，2，3，5，8，13， 
21..……. 其 中 0 属于 第 0 项 ，1 属 于 第 1 项 。 从 第 2 项 开始 ， 当 前 项 的 数 是 其 
之 前 两 项 数 的 和 ， 所 以 可 以 用 这 个 数学 方程 来 表达 : Fn=F (n- 
1) +F (n-2) ，n>1 且 n 属 于 自然 数 。 代 码 清单 9-14 展 示 了 分 别 使 用 循环 
迭代 法 以 及 函数 递归 调用 的 方法 来 求 得 第 n 项 的 斐 波 那 契 数列 的 值 。 





代码 清单 9-14 ”获取 墓 波 那 契 数列 的 指定 项 的 值 





#include <stdio.h> 


/** 用 循环 迭代 实现 获取 辈 波 那 契 数列 第 nItem 项 的 值 */ 


static int FibonacciIteration(unsigned nItem) 









































// 这 里 声明 的 former 表 示 台 作 为 第 9 项 的 值 ，current 则 表示 第 1 项 的 值 
int former = 0, current = 1; 


























if (nItem == 0) 
return former,; 

else if (nItem == 1) 
return current,; 


for (int n = 2; Nn <= nItem; n++) 


// 计算 当前 项 的 值 

int newValue = former + current ， 
// 将 前 一 项 的 值 赋值 给 前 第 二 项 
former = current,; 

current = newValue; 























} 


return current ; 


} 
/** 用 函数 递归 调用 实现 获取 斐 波 那 契 数列 第 nItem 项 的 值 */ 


static int FibonacciRecursion(unsigned nItem) 












































if (nItem == 0) 


return ©; 
else if (nItem < 2) 
return 工 ; 














// 递归 调用 FibonacciRecursion， 求 得 当前 第 nItem 项 的 值 
return FibonacciRecursion(nItem - 1) + FibonacciRecursion(nItem - 2); 


int main(int argc, const char * argv[]) 


int value = FibonacciIteration(8); 
printf("value = %d\n", value); 

// 第 8 项 的 值 为 21 

value = FibonacciRecursion(8); 
printf("value = %d\n", value); 








图 9-6 展 示 了 递归 调用 代码 清单 9-14 中 的 FibonacciRecursion (5) 的 
调用 流程 。 
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图 9-6” 斐 波 那 外 数 列 的 函数 递归 调用 流程 图 





图 9-6 中 ， 和 窃 形 框 表示 当前 调用 的 FibonacciRecursion 函 数 ， 其 上 
的 数字 表示 当前 调用 是 第 几 次 调用 ， 比 如 (1) 表示 第 一 次 调用 ， (2) 
表示 第 二 次 调用 。 从 这 个 图 中 我 们 也 能 容易 发 现 ， 某 一 次 函数 调用 的 结 


果 就 是 它 下 面 两 次 调用 结果 的 和 。 所 以 FibonacciRecursion (5) 函数 调 


用 的 最 终结 果 就 是 5。 


9.6 ”内 联 函 数 


从 C99 标 准 开始 起 ，inline 关 键 字 被 正式 纳入 C 语 言 标 准 。 在 C11 标 
准 中 ，inline 与 下 一 小 节 将 描述 的 _Noreturn 都 属于 函数 说 明 符 (function 
specifier) 。C11 标 准 中 明确 指出 ， 函 数 说 明 符 应 该 仅 用 在 对 一 个 函数 标 
识 符 的 声明 中 。 





如 果 一 个 函数 用 inline 函 数 说 明 符 进 行 声明 ， 那 么 该 函数 是 一 个 内 
联 函数 。 内 联 函数 是 对 C 语 言 编 译 占 的 暗示， 建议 编译 占 对 该 函数 的 调 
用 尽 可 能 地 快 。 





具有 内 部 连接 的 任 一 函数 都 可 以 作为 一 个 内 联 函 数 。 而 对 于 具有 外 

连接 的 函数 则 具有 以 下 限制 : 如果 一 个 函数 用 inline 函 数 说 明 符 进行 

声明 ， 那 么 它 也 应 该 定义 在 同一 翻译 单元 中 。 如 果 对 一 个 函数 在 所 有 文 
件 作 用 域 的 声明 ， 在 茶 一 翻译 单元 中 包含 了 inline 函 数 说 明 符 ， 而 没有 
extern， 那 么 在 该 翻译 单元 中 的 定义 是 一 个 内 联 定 义 。 内 联 定义 不 提供 
对 该 函数 的 外 部 定义 ， 并 且 也 不 禁用 它 在 男 一 个 翻译 单元 中 的 外 部 定 
义 。 内 联 定 义 提 供 了 对 一 个 外 部 定义 的 蔡 代 品 ， 编 译 占 可 以 用 来 实现 在 
同一 翻译 单元 中 对 该 函数 的 任 一 调用 (选择 内 联 定义 的 调用 或 外 部 定义 
的 调用 ) 。 对 函数 的 调用 使 用 的 是 内 联 定义 还 是 外 部 定义 则 是 未 指定 
的 。 














共有 外 部 连接 的 一 个 函数 的 内 联 定义 ， 不 应 该 包含 具有 静态 或 线程 
存储 周期 的 一 个 可 修改 对 象 ， 并 且 也 不 应 该 包含 对 一 个 具有 内 部 连接 标 
识 符 的 引用 。 


代码 清单 9-15 展 示 了 内 联 函 数 的 使 用 以 及 一 些 注意 事项 。 


代码 清单 9-15 ”内 联 函 数 的 定义 与 使 用 





// main.c 源 文件 
#include <stdio.h> 


// Func 是 一 个 具有 内 联 定义 的 函数 


inline int Func(int ny) 


























return n * 2; 


extern inline int Func2(int ny) 


// 对 于 具有 外 部 连接 的 一 个 函数 的 内 联 定义 ， 不 应 该 包含 可 修改 的 静态 存储 周期 对 象 。 
// 这 里 编译 器 可 能 会 报 出 警告 
static int s,; 






































s += nN; 


return s +n; 


} 


static inline int Func3(int n) 


// 对 于 具有 内 部 连接 的 一 个 内 联 函 数 ， 可 以 包含 可 修改 的 静态 存储 对 象 


static int s,; 








Ss: + hs 


return s +n; 


// MyTest 函 数 定义 在 he1L1o . c 源 文件 中 
extern void MyTest(void); 





int main(int argc, const char * argv[]) 


int result = Func(3); 
printf("result = %d\n", result); 


MyTest(); 

// 调用 完 MyTest( ) 函 数 之 后 ，Func2 函 数 中 静态 对 象 的 值 变 为 了 20 
result = Func2(10); 
printf("result in main is: %d\n", result); 


// 在 调用 Func3 函 数 之 前 ， 它 所 包含 的 静态 对 象 s 的 值 为 9 


















































result = Func3(1); 
printf("result 1 = %d\n", result); 


// 在 调用 了 一 次 Func3 函 数 之 后 ， 它 所 包含 的 静态 对 象 s 的 值 为 1 
result = Func3(2) 
printf("result 2 = %d\n", result); 




















} 
// hello.c 源 文件 
#include <stdio.h> 


// 这 里 将 Func 定 义 为 具有 外 部 连接 的 一 个 函数 


int Func(int n) 


























return n * 3; 


inline int Func2(int n) 
static int s,; 
Ss += nN; 


return s + n; 


void MyTest(void) 
printf("value is: %d\n", Func(2)); 


int result = Func2(20); 
printf("result in MyTest is: %d\n", result); 





代码 清单 9-15 分 为 两 个 源 代码 ， 第 一 个 是 main.c， 第 二 个 是 
hello.c。 这 两 个 源 文件 放 在 同一 工程 内 ， 然 后 编译 后 连接 生成 可 执行 文 
件 。 在 main.c 中 ， 定 义 了 一 个 具有 内 联 定 义 的 Func 函 数 《〈 它 没有 用 extern 
修饰 ， 仅 具有 inline 函 数 说 明 符 ) ， 而 在 hello.c 中 则 定义 了 相同 函数 名 
Func 的 外 部 定义 ， 在 连接 时 不 会 引发 符号 重 定义 的 冲突 。 但 是 ， 在 
main.c 的 Func 定 义 中 ， 倘 车 在 inline 前 面 添 加 exterm， 则 会 引发 Func 符 号 
重 定义 的 连接 错误 。 因 为 此 时 它 真 具有 了 外 部 连接 ， 而 不 是 一 个 仅 具 有 
内 联 定义 的 函数 。 

















在 main 国 数 中 ， 第 一 条 调用 Func 函 数 的 语句 ， 它 可 以 被 编译 器 直接 


翻译 为 : int result=3*2; 。 内 联 函 数 的 作用 就 是 建议 编译 器 以 最 快 的 方 
式 调用 阔 数 。 那 么 将 函数 中 的 语句 内 容 下 接 扩 展 出 来 ， 使 得 与 当前 函数 
调用 者 的 上 下 文 结合 进行 优化 ， 无 疑 是 最 快 的 方式 。 当 然 ，inline 仪 仅 
起 到 建议 的 作用 ， 内 联 函 数 的 调用 是 做 代码 展开 还 是 直接 做 普通 的 函数 
调用 完全 由 编译 器 做 最 后 的 决定 。 





函数 Func2 与 Func3 则 呈现 了 上 文 所 描述 的 对 内 联 函 数 中 包含 静态 存 
储 周 期 对 象 的 限制 。Func2 之 所 以 不 能 在 函数 体内 包含 静态 对 象 ， 是 因 
为 内 联 定义 的 函数 其 本 质 上 仍然 是 外 部 的 ， 也 就 是 说 尽管 它 可 以 出 现在 
不 同 的 翻译 单元 ， 但 它 仍然 只 具有 一 个 实体 。 也 就 是 说 ， 其 内 部 定义 的 
静态 对 象 对 于 整个 执行 程序 而 言 也 是 唯一 的 ， 所 以 它 在 不 同 源 文 件 中 的 
调用 ， 其 内 部 静态 对 象 s 的 值 会 受到 影响 《〈 即 具有 不 可 见 的 副作用 ) 。 
而 具有 static 存 储 类 的 内 联 函 数 本 身 就 具有 内 部 连接 ， 因 此 每 个 翻译 单元 
具有 一 个 独立 的 对 象 副 本 ， 所 以 在 多 个 源 文件 中 进行 调用 时 相互 之 间 不 
会 有 任何 影响 。 对 函数 中 包含 静态 存储 周期 对 象 的 情况 的 详细 介绍 ， 请 
参考 11.3 节 。 




















9.7 ”函数 的 返回 类 型 与 无 返回 函数 


前 面 儿 节 讲解 了 函数 的 形 参 与 实 参 的 传递 以 及 函数 的 调用 等 ， 本 市 
将 详细 描述 函数 的 返回 。 


在 C 语 言 中 ， 函 数 的 返回 类 型 几乎 可 以 是 任意 类 型 ， 包 括 整 型 、 浮 
点 型 等 基本 类 型 ， 枚 举 、 结 构 体 、 联 合体 等 用 户 自 定义 类 型 ， 也 可 以 是 
指向 上 述 这 些 类 型 的 指针 ， 但 唯 独 不 允许 数组 类 型 。 除 了 返回 类 型 为 
void 的 情况 外 ， 一 个 函数 中 的 任 一 分 支 代码 最 终 必 须要 触 磁 一 条 return 语 
句 进行 函数 返回 。 对 于 返回 类 型 为 void 的 函数 ， 在 其 函数 体 结尾 处 会 默 
认 隐 含 一 条 retum 语 句 。 当 函数 体 中 出 现 retum 语 句 时 ，returm 后 面 跟 着 的 
表达 式 的 类 型 必须 要 与 函数 返回 类 型 兼容 ， 如 果 return 后 面 是 一 条 衬 表 
达 式 《比如 直接 以 分 号 结尾 ) ， 那 么 表示 返回 的 是 一 个 void 表达 式 。 








代码 清单 9-16 展 示 了 函数 返回 的 一 些 常 用 技巧 。 


代码 清单 9-16 ”C 语 言 函 数 返 回 的 常用 技巧 





#include <stdio.h> 


// 这 里 定义 了 一 个 返回 类 型 为 nt 的 函数 
static int MyIntFunc(int a) 


{ 

// 确保 函数 最 终 执 行 完 时 都 要 触 碰 一 条 return 语 句 。 
// 这 里 的 jf、if-else、 以 及 else 语 句 后 面 的 return 语 句 都 不 能 省 
// 如 果 else 后 面 的 return 0 省 了 之 后 ， 
// 在 a 等 于 0 的 情况 下 函数 的 返回 值 是 不 确定 的 
if(a > 0) 

return 100; 
else if(a < 0) 

return -100; 


















































































































































数 用 一 个 _Noreturn 函 数 说 明 符 来 声明 ， 那 么 讶 
者 。 所 以 用 Noreturn 修 饰 的 函数 ， 其 返回 类 型 应 该 


else 
return 090; 


} 


// 这 里 定义 了 一 个 返回 类 型 为 int* 的 函数 
static int* MyIntPtrFunc(void) 

















static int s = 100; 


return &s; 

















// 这 里 定义 了 一 个 返回 类 型 为 一 个 结构 体 的 函数 
static struct SA { int a; float f; } MyStructFunc(void) 





return (struct SA){ 100, -10.25f }; 

















// 这 里 定义 了 一 个 返回 类 型 为 一 个 枚 举 的 函数 
static enum { MY_ENUM1，MY_ENUM2 } MyEnumFunc(void) 
‘ 








return MY_ENUM2 ， 


static void MyVoidFunc(int a) 
if(a > 0) 


puts("a is above zero!"),; 








// 这 里 使 用 (void ) 投 射 操作 将 表达 式 转 为 void 表达 式 。 
// 这 里 要 注意 的 是 ，printf 的 返回 类 型 为 nt， 而 不 是 void 
return (a > 10)? (void)printf("a = %d\n", a) : (void)0; 


























int main(int argc, const char* argv[]) 


int a = MyIntFunc(1); 
printf("a = %d\n", a); 


int *p = MyIntPtrFunc(); 
printf("*p = %d\n", *p); 


struct SA Sa = MyStructFunc(); 
printf("sum of sa is: %.2f\n", sa.a + sa.f); 


a = MyEnumFunc(); 
printf("enum is: %d\n", a); 


MyVoidFunc(100); 





C11 标 准 引 入 了 _Noreturn 关 键 字 ， 它 也 是 函数 说 明 符 。 如 果 一 个 函 


辫 图 数 不 应 该 返 


回 给 其 调用 


此 外 ， 





C11 标 准 也 引入 了 <stdnoreturn.h> 头 文件 ， 其 中 将 _Noreturn 定 义 为 了 
noreturn， 因 此 我 们 应 该 尽量 包含 <stdnoreturn.h> 头 文件 ， 然 后 直接 使 用 


noreturn。 


在 应 用 端 开发 中 ，_Noreturn 很 少 使 用 。 该 函数 一 般 用 于 骨 入 式 系 统 
中 某 些 异 名 处 理 例 程 ， 或 是 用 于 线程 处 理 例 程 ， 倘 和 奋 这 些 例 程 
Croutine) 不 做 任何 返回 的 话 。 在 C11 标 准 库 中 ， 像 longjmp、abort、 
exit、qduick_exit 等 库 函 数 均 以 _Noreturm 进 行 声 明 。 代 码 清单 9-17 将 说 明 
_Noreturn 的 一 些 使 用 方式 与 规则 。 


代码 清单 9-17 _Noreturn 的 使 用 





#include <stdio.h> 

#include <stdlib.h> 

#include <stdnoreturn.h> 

// 用 noreturn 声 明了 函数 Routine。 

// 在 Routine 函 数 内 不 能 出 现任 何 return 语 句 
noreturn void Routine(int n) 


























if(n > 0) 


printf("n = %d\n", nN); 

















// 这 里 将 中 止 程序 执行 ， 应 用 程序 执行 到 abort( ) 时 将 会 引发 异 























abort(); 

else 

{ 
// 这 里 退出 整个 程序 的 执行 
puts("Exit!"); 
exit(n); 

} 


} 
int main(int argc, const char * argv[]) 


Routine(-10); 





代码 清单 9-17 中 所 调用 的 abort () 以 及 exit () 库 函 数 的 原型 都 声 


明 在 <stdlib.h> 头 文件 中 。 


9.8 指 回 函 数 的 指针 





C 语 言 中 的 指针 是 一 个 非常 灵活 、 强 大 、 适 用 范围 广 的 属性 ， 一 
指针 可 指向 几乎 所 有 对 象 类 型 ， 它 也 能 指向 任何 函数 。 其 实在 C 语 言 
中 ， 函数 标志 用 于 表达 式 时 就 已 经 表征 了 一 个 指 癌 该 函数 类 型 的 指 
a 





比如 我 们 声明 了 一 个 函数 Func 一 一 “void Func (void) ; ”那么 对 于 
函数 调用 表达 式 一 一 Func〈() 而 言 ， 其 实 这 里 的 Func 后 级 表达 式 就 已 经 
表示 了 一 个 指向 返回 类 型 为 void， 且 参数 列表 为 空 的 函数 的 指针 ， 该 类 
型 表示 为 : 








void (*)(void) 





半数 指针 类 型 的 通用 表达 形式 为 : 














可 类 型 (* cv 限定 符 可 选 ) ( 形 参 列表 ) 


疝 








旨 针 对 象 的 标识 符 放 在 可 缺 省 的 cv 限定 符 之 后 、“) ”之 前 。cv 限 定 
符 即 为 const、volatile 限 定 符 ， 这 些 将 在 第 12 章 中 详细 介绍 。 另 外 ， 对 于 
有 些 C 语 言 实现 含有 函数 调用 约定 的 ， 那 么 在 函数 指针 类 型 中 将 函数 调 
用 约定 说 明 符 放 在 * 前 面 ， 比 如 void ( stdcall (*) (void) 。 函 数 调用 
约定 详 见 第 15 章 。 





声明 一 个 指向 函数 的 指针 对 象 时 ， 其 形 参 列表 与 返回 类 型 的 要 求 与 
一 般 函 数 声明 的 要 求 一 样 ， 返 回 类 型 以 及 形 参 类 型 可 以 是 不 完整 类 型 。 

函数 指针 对 象 可 以 立即 对 它 所 指向 的 函数 进行 调用 《〈 这 在 处 理 器 中 
对 应 的 是 寄存 器 间接 调用 指令 ) 。 一 个 函数 标志 本 身 即 可 表示 为 一 个 指 
向 该 函数 类 型 的 指针 ， 而 如 果 在 它 前 面 加 地 址 操作 符 &， 同 样 也 表示 指 
向 该 函数 的 指针 ， 两 者 在 类 型 上 是 完全 等 同 的 。 也 就 是 说 ， 如 果 有 : 
void Func (void) ， 那 么 Func 与 &Func 的 类 型 都 为 void (*) (void) 类 
型 。 





此 外 ， 正 如 我 们 很 早 之 前 所 说 的 ， 任 一 对 象 都 有 其 地 址 ， 那 么 指向 
函数 的 指针 对 象 也 不 例外 ， 如 果 对 指向 函数 的 指针 对 象 取 了 其 地 址 ， 那 
么 其 类 型 表示 为 在 〈) 中 的 “*” 之 前 、“ (〈” 之 后 再 加 一 个 “*”。 比 如 ， 如 
果 存 在 一 个 指向 函数 的 指针 对 象 
&pFunc 的 类 型 即 为 void (**) (void) 。 这 里 要 注意 的 是 ，pFunc 与 上 
面 描述 的 Func 是 不 同 的 ， 因 为 Func 本 身 是 一 个 函数 标志 ， 所 以 &Func 仍 
然 可 表示 为 指向 一 个 函数 的 指针 ， 以 至 于 它 与 Func 在 类 型 上 是 等 同 的 ; 
而 pFunc 本 质 上 就 是 一 个 指向 函数 的 指针 对 象 标识 符 ， 所 以 &pFunc 就 是 
指向 函数 指针 对 象 的 指针 。 


void (*pFunc) (void) ， 那 么 








代码 清单 9-18 展 示 了 指 癌 函数 指针 的 用 法 。 


代码 清 蛙 9-18 ” 指 癌 函数 的 指针 示例 


#include <stdio.h> 
#include <stdarg.h> 











// 这 里 仅 声 明了 MyStruct 结 构 体 类 型 
struct MyStruct,; 














信人 
RS 
Cd 
: 煌 双流 
RSE 


有 声明 J 人 指针 p， 

指向 的 函数 其 返回 类 型 是 一 个 不 完整 类 型 MyStruct 类 型 ， 
参 s 与 a 同 样 也 都 是 不 完整 类 型 。 
// 这 里 形 参 中 可 加 标识 符 ， 当 然 形 参 标识 符 也 可 缺 省 ， 这 与 声明 函数 原型 时 一 样 
static struct MyStruct (*p)(struct MyStruct s, int a[*]) = NULL， 


// 这 里 声明 函数 Test， 在 main 函 数 下 四 
static void Test(void); 





































































































定义 












































// 这 里 定义 了 Foo 函 数 ， 它 含有 0 
// 其 项 入 对 不 定 参 数 进 和 了 求 和 运算 ， 然 后 将 结果 返回 


static int Foo(int n, ...) 






































va_list ap; 
va_start(ap, n); 


int sum = 0; 

for(int i = 0; i < Nn; i++) 
sum += va_arg(ap, int); 

va_end(ap); 


return sum; 


int main(int argc, const char * argv[]) 


// 这 里 声明 了 指向 函数 Test 的 指针 对 象 pf 
void(*pf)(void) = Test; 














































































































// 通过 函数 指针 pf 间接 调用 Test 函 数 ， 这 里 也 可 以 使 用 pf( ) 进 行 调用 。 
于 函数 调用 操作 符 ( ) 的 优先 级 大 于 间接 操作 符 *， 
// 所 以 这 里 需要 使 用 (* pf) 将 它 作为 整体 ， 作 为 函数 标志 的 后 绥 表 达 式 

































































// 这 里 声明 了 指向 函数 的 指针 pFunc， 其 形 参 标识 符 缺 省 ， 
// 用 Fo 函数 地 址 对 它 进行 初始 化 。 这 里 的 & 可 缺 省 
int(*pFunc)(int, ...) = &Foo; 










































































// 这 里 用 指向 函数 的 指针 pFunc 进 行 间接 的 函数 调用 
int result = pFunc(3, 10, 20, 30); 
printf("result = %d\n", result); 


// 这 里 声明 了 指向 函数 指针 对 象 的 指针 
int(**pp)(int, ...) = &pFunc; 

































































// 这 里 通过 指向 函数 指针 的 指针 pp 做 Foo 函 数 的 间接 调用 
result = (*pp)(5， 1, 2, 3, 4, / 
printf("result2 = %d\n", result); 





// 将 pp 所 指 对 象 的 值 置 空 ， 使 得 pFunc 对 象 的 值 为 空 
*pp = NULL 


if(pFunc == NULL) 
puts("Null!"),; 
} 


// 这 里 对 MyStruct 进 行 定义 
struct MyStruct 
{ 
































int a; 
float f; 
}; 


static struct MyStruct Func(struct MyStruct s, int a[]) 
printf("sum = %f\n", s.a + S.f + a[0]); 


return s; 


// 对 Test 函 数 做 定义 
static void Test(void) 


{ 
// 在 文件 作用 域 声明 的 指向 函数 的 指针 p 指 向 Func 函 数 


p = Func; 


// 通过 指向 函数 的 指针 p 进 行 间接 函数 调用 
p((struct MyStruct){.a = 10, .f = 0.5f}, (int[]){1i, 2, 3}); 




































































代码 清单 9-18 列 出 了 指向 函数 的 指针 的 各 种 使 用 方式 。 此 外 ， 指 问 
函数 的 指针 对 象 也 能 作为 一 个 函数 的 参数 ， 同 时 一 个 函数 的 返回 类 型 也 
可 以 为 指向 函数 的 指针 类 型 。 比 如 : void (*func (int (*p) 

(void) ) ) (int) ;就 声明 了 一 个 返回 类 型 为 void (*) (int) 、 珊 有 
一 个 类 型 为 int (*) (void) 形 参 的 函数 func。 


9.9 “C 语 言 中 的 主 函 数 main 


在 C 语 言 中 ， 将 应 用 启动 时 调用 的 函数 命名 为 main 函 数 。C 语 言 实 
现 不 需要 对 此 函数 做 原型 声明 。 它 应 该 被 定义 为 返回 类 型 为 int， 并 且 不 
带 任何 形 参 的 函数 ， 如 : int main (void) {/*...*/};， 或 者 带 有 两 个 形 参 
的 函数 ， 如 : int main (int argc，char*argv[] ) {/*...*/}。 这 两 个 形 参 所 
对 应 的 实 参 是 在 执行 该 程序 时 传 入 的 。argc 一 般 存 放 执行 当前 程序 时 输 
入 的 命令 字符 串 个 数 ，argvy 则 存放 了 指向 各 个 输入 字符 串 的 指针 。 假 设 
我 们 现在 对 C 源 文件 编译 构建 后 ， 生 成 了 一 个 名 为 test 的 可 执行 文件 。 那 
么 我 们 在 控制 台中 输入 test argl arg2， 再 按 回 车 ， 那 么 此 时 ，main 函 数 
的 第 一 个 参数 argc 的 值 为 9， 因为 test 其 实 融 属于 要 传 入 到 argv 数 组 的 第 1 
个 参数 ， 然 后 后 面 跟着 2 个 命令 行 参数 arg1 和 arg2; 所 以 argv 对 应 的 实 参 
内 容 为 ，{“test*"，“arg1”，“arg2”}， 即 由 应 用 程序 名 与 其 命令 行 参 数字 

符 串 所 构成 的 数组 。 如 果 将 main 函 数 声明 为 带 有 两 个 形 参 的 形式 ， 那 么 
它们 应 该 遵循 以 下 约束 : 





1) argc 的 值 应 该 是 一 个 非 负 数 。 
2) argv[argc] 应 该 是 一 个 空 指 针 。 


3) 如 果 argc 的 值 大 于 零 ， 那 么 数组 成 员 argv[0] 到 argv[argc-1] 应 该 包 
含 指向 字符 串 的 指针 ， 这 些 字 符 串 在 程序 启动 前 由 主机 环境 给 出 。 如 果 


argc 的 值 大 于 1， 那 么 argv[1] 全 argv[argc-1] 所 指 癌 的 字符 串 才 表示 程序 形 
参 ， 即 当前 应 用 名 后 面 的 命令 行 参数 。 





4) 形 参 argc 和 argv 以 及 argv 数 组 所 指 同 的 字符 串 可 以 在 程序 中 修 
改 ， 并 且 在 程序 启动 和 终止 之 间 保 留 其 最 后 被 修改 的 值 。 


main 函 数 的 返回 值 相当 于 调用 库 函 数 exit 所 传 入 的 实 参 值 。 如 果 
main 函 数 中 缺 省 return 语 句 ， 那 么 默认 为 return 0。 


代码 清单 9-19 展 示 了 了 main 函数 参数 的 使 用 。 


代码 清单 9-19 _ main 函数 的 执行 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


if(argc == 0) 
return -1; 


// argv[9] 指 向 的 字符 串 为 当前 程序 名 
printf("The program name is: %s\n", argv[0]); 











// 以 下 依次 输出 程序 名 后 面 的 参数 名 
for(int i = 1; i < argc; i++) 
printf("arg %d: %s\n", i, argv[i]); 


// 我 们 可 以 对 argc、argv 参 数 进行 任意 修改 
argc = 10; 
































argv[9] = "hello"; 
argv[1] = “world"; 
argv = NULL; 

















// 缺 省 return 语 句 ， 这 里 默认 为 return 0 











假定 我 们 将 代码 清单 9-19 编 译 构建 后 生成 了 test 可 执行 文件 。 然 后 
在 控制 台 下 ， 进 入 到 test 当 前 路 径 ， 再 输入 test argl arg2， 那 么 结果 将 会 


输出 : 





The program name is: test 
arg 1: arg1 
arg 2: arg2 





数 ， 因 此 main 了 消 数 必须 要 有 
数 也 不 能 带 有 inline、 


这 里 ， 程 序 默 认 的 入 口 函 数 就 是 mainE 
外 部 连接 ， 它 不 能 是 static 的 。 此 外 ，mainE 


_Noreturn 等 函数 说 明 符 。 


站 


9.10 ”函数 与 函数 调用 作为 sizeof 操 作 符 


C 语 言 标准 明确 规定 ，sizeof 操 作 符 不 应 该 应 用 于 : 中 具有 函数 类 
型 ; 包 一 个 不 完整 类 型 的 表达 式 ;， 名 访问 一 个 位 域 成 员 的 表达 式 。 
_Alignof 操 作 符 不 应 该 应 用 于 一 个 函数 类 型 或 不 完整 类 型 。 这 里 大 家 要 
注意 的 是 ， 当 一 个 函数 标志 作为 sizeof 或 _Alignof 的 操作 数 时 ， 它 不 会 被 
隐 式 转换 为 指向 该 函数 类 型 的 指针 类 型 ， 这 个 与 它 单 独 用 于 其 他 计算 表 
达 式 有 所 不 同 。 因 此 ， 假 定 我 们 定义 了 一 个 函数 : void Foo (void) ， 
那么 sizeof (Foo) 的 结果 是 未 定义 的 ; 而 sizeof (&Foo) 是 合法 的 ， 其 
结果 相当 于 sizeof (void (*) (void) ) ， 也 就 是 一 个 指针 对 象 大 小 。 











如 果 sizeof 的 操作 数 是 一 个 函数 调用 表达 式 ， 那 么 它 的 结果 相当 于 
sizeof ( 消 数 返回 类 型 )， 同 时 ， 作 为 sizeof 操 作 数 的 函数 调用 将 不 会 发 
生 。 由 于 函数 返回 类 型 不 能 是 一 个 可 变 修改 类 型 ， 因 此 这 里 不 会 涉及 在 
运行 时 对 可 变 修改 类 型 对 象 所 占 存 储 空 间 大 小 的 计算 。 





代码 清单 9-20 展 示 了 sizeof 作 用 域 函 数 的 一 些 代码 。 


代码 清单 9-20 ”sizeof 与 代码 





#include <stdio.h> 
static int Funci(void) 
puts("Func1"); 


return 0; 


} 


static void Func2(void) 


int 


puts("Func2"); 


main(int argc, const char * argv[]) 





























// 这 里 由 于 Funci 返 回 的 是 ijnt 类 型 ， 所 以 sizeof 的 结果 相当 于 sizeof(int) 
size_t size = sizeof(Func1()); 
printf("Func1() size is: %zu\n", size); 


// 由 于 Func2 的 返回 类 型 是 void， 它 属于 不 完整 类 型 ， 
// 因此 理论 上 这 里 的 sizeof 结 果 在 标准 里 是 未 定义 的 ， 
// 在 GCC 与 Clang 的 实现 上 ， 结 果 为 1 

size = sizeof(Func2()); 

printf("Func2() size is: %zu\n", size); 


// 这 里 将 Func1， 一 个 函数 标识 作为 Sizeof 操 作 数 ， 其 行为 是 未 定义 的 
size = Sizeof(Func1) ， 
printf("Function size is: %zu\n", size); 


// 这 里 对 &fFunc1， 即 一 个 函数 指针 类 型 作为 Sizeof 操 作 数 ， 
// 该 值 与 Sizeof(void(*)(void) ) 相 同 

size = sizeof(&Func1); 

printf("Function pointer size is: %zu\n", size); 
















































































































































































9.11 本 章 小 结 


本 章 主 要 介绍 了 C 语 言 的 函数 ， 对 函数 返回 类 型 、 形 参 以 及 函数 调 
用 与 实 参 传 递 等 知识 进行 了 全 方位 的 讲解 。 通 过 对 本 章 的 学 习 ， 各 位 应 
该 能 理解 并 自己 会 写 函 数 ， 将 自己 的 一 些 功 能 远 辑 给 模块 化 、 抽 象 化 。 
在 本 半 中 ， 比 较 难 以 理解 的 可 能 就 属 函 数 递归 调用 了 ， 如 果 大 家 是 专攻 
于 一 些 数学 算法 的 ， 希望 能 再 好 好 消化 一 下 。 





第 10 章 C 语 言 预 处 理 需 


C 语 言 编 译 器 前 端 还 分 为 预 处 理 阶 段 与 编译 阶段 。 预 处 理 阶段 是 通 
过 C 语 言 的 各 类 预 处 理 右 将 指定 的 一 些 字符 符 写 直接 丛 换 到 即将 编译 的 
源 代码 。 预 处 理 器 在 跨 平台 整合 上 很 有 和 帮助， 我 们 一 般 可 以 利用 预 处 理 
名 针对 有 差异 的 系统 平台 安插 不 同 的 源 代码 。 除 此 之 外 ， 当 前 遵循 C11 
标准 的 预 处 理 器 的 功能 已 经 十 分 强劲 ， 我 们 可 以 利用 预 处 理 絮 生成 灵活 
强大 的 代码 ， 可 以 把 东 些 代码 逻辑 通过 宏 定 义 来 高 度 抽象 化 。 








用 于 预 处 理 的 指示 符 称 为 预 处 理 指示 符 〈preprocessing 
directives) ，C 语 言 主 要 有 三 大 类 预 处 理 指 示 符 一 一 条 件 段 (if- 
section) 预 处 理 指示 符 、 控 制 行 (control-line〉 预 处 理 指 示 符 、 空 指示 
从 (null directive〉。 本 章 将 会 为 大 家 介绍 条 件 预 处 理 、 文 件 包含 、 宏 

ES 


蔡 换 、 行 控制 、 错 误 指示 和 人 符 、 编 译 指示 (pragma) 指示 符 、 空 指示 符 以 


及 C11 标 准 中 预定 义 的 宏 名 。 


对 于 任意 一 条 预 处 理 指 示 符 ， 除 了 _Pragma 之 外 ， 其 他 的 都 必须 是 
以 # 符 号 打头 ， 并 且 # 和 伴 号 必须 出 现在 每 一 行 的 最 前 面 。 也 就 是 说 ， 如 果 
我 们 要 在 源 文 件 中 菏 一 行使 用 一 条 预 处 理 指示 符 ， 那 么 最 开头 就 得 写 上 
#， 前 面 除 了 空 日 符 之 外 不 允许 出 现 其 他 任何 字符 。 一 条 预 处 理 指示 符 
的 最 后 都 无 需 加 分 号。 对 于 预 处 理 组 (比如 条 件 段 预 处 理 指示 符 〉 而 

















已 一 Ar 


言 ， 其 作用 范围 从 组 的 起 始 指 示 符 开始 的 下 一 行 一 直到 该 组 结束 指示 符 
的 上 一 行 。 对 于 控制 行 预 处 理 需 指示 符 《〈 比 如 宏 定 义 ) 而 言 ， 一 行 就 定 
义 了 某 个 符 与 或 执行 茶 个 动作 ， 它 们 不 作用 到 下 一 行 。 


名 as， C 语 言 的 预 处 理 圳 拥有 目 己 独立 的 文法 ， 我 们 可 以 将 它 
看 作为 舱 入 在 C 源 代码 中 的 一 段 编 译 指示 脚本 ， 用 于 在 当前 源 文件 中 构 
建 指定 的 后 续 要 进行 编译 的 C 源 代码 。 所 以 大 家 不 要 将 它 与 之 前 描述 的 
C 语 言 的 一 些 语 法 特征 给 摘 混 ， 而 使 用 预 处 理 融 就 好 比 在 使 用 元 编程 








(metaprogramming) 。 


10.1 宏 定 义 








宏 定义 属于 控制 行 预 处 理 指示 符 。 以 #define 定 义 的 一 个 符号 称 为 宏 
(macro) 。 这 里 ，# 与 define 之 间 可 以 存在 空白 符 〈 换 行 符 除 外 ) ， 但 
对 于 某 些 C 代 码 编辑 嚣 而 言 ， 一 旦 # 与 define 之 间 存 在 空白 符 ， 可 能 会 导 
致 编辑 器 在 词法 上 无 法 识别 ， 从 而 无 法 获得 该 有 的 语法 高 沈 。 因 此 建议 
各 位 在 用 以 桂 头 的 任何 预 处 理 指示 符 的 时 候 ，# 与 跟 在 它 后 面 的 指示 符 
之 间 不 要 有 任何 空 日 符 。 








在 C 语 言 中 ， 宏 的 定义 有 两 种 形式 ， 一 种 是 类 似 对 象 的 宏 定 义 ， 男 
一 种 是 类 似 函 数 的 宏 定义 。 类 似 对 象 的 宏 定义 的 形式 为 : 





# define ”标识 符 蔡 换 列表 换行 符 





类 似 函 数 的 宏 定义 形式 为 : 





# define 标识 符 ( 参 数列 表 ) 。” 亚 换 列表 换行 符 





以 上 定义 中 ,“ 蔡 换 列 表 ” 可 缺 省 。 这 里 要 注意 的 是 ， 类 似 函 数 的 宏 
定义 中 ， 标 识 符 与 《之 间 不 应 该 存在 任何 空白 符 ， 人 否则 预 编 译 器 可 能 会 
将 () 作为 类 似 对 象 宏 定义 的 蔡 换 列表 中 的 一 部 分 。 








在 C 语 言 预 处 理 过 程 中 ， 蔡 换 列 表 会 将 当前 宏 标识 符 给 完全 蔡 换 


掉 。 我 们 称 两 个 答 换 列表 是 完全 等 同 的 ， 当 且 仅 当 该 两 个 蔡 换 列表 中 的 
预 处 理 符号 〈preprocessing token) 的 数量 、 次 序 、 拼 写 以 及 空白 分 隔 符 
的 数量 相同 ， 对 于 所 有 空白 分 隅 符 都 认为 是 等 同 的 〈 比 如 一 个 tab 制 表 
和 从 与 一 个 空格 符 是 完全 相同 的 ， 因 此 NN 个 空格 符 与 一 个 空格 符 是 等 同 


的 ， 当 然 这 里 N 必 须 大 于 零 ) 。 


对 类 似 函数 的 宏 〈 以 下 简称 为 宏 函 数 ) 的 “调用 ”与 一 般 C 函 数 调用 
还 有 一 点 不 同 ， 即 宏 函 数 的 实 参 可 以 不 传 ， 此 时 在 宏 蔡 换 时 会 使 用 占 位 
标记 (placemarker)〉 预 处 理 符 写 来 代 奉 。 占 位 标记 预 处 理 符 写 在 C 语 言 
语法 上 不 会 体现 出 来 ， 它 作为 C 语 言 预 处 理 咒 的 一 种 标准 实现 方式 进行 
定义 。 











宏 定义 的 作用 范围 是 从 它 定 义 完 的 那个 位 置 起 一 直到 当前 源 文件 结 
束 ， 筷 不 受 语 句 块 作用 域 、 函 数 作 用 域 等 影响 ， 因 为 正如 本 章 开 头 所 提 
到 的 ， 预 处 理 部 分 与 C 源 代码 正文 部 分 采用 的 是 完全 不 同 的 文法 体系 ， 
而 且 预 处 理 器 〈preprocessor) 是 独立 于 编译 器 而 存在 的 。 因 此 从 严格 意 
义 上 来 说 ， 我 们 在 使 用 类 似 函 数 的 宏 的 时 候 也 不 能 将 它 称 之 为 “调用 ”， 
所 以 后 续 统 一 采用 “使 用 ”。 





前 面谈 了 关于 宏 的 基本 概念 以 及 一 些 注意 事项 之 后 ， 下 面 我 们 就 来 
谈 谈 宏 的 基本 使 用 。 


10.1.1 宏 的 基本 使 用 





前 面 提 到 ，#define 用 于 定义 一 个 宏 ， 当 在 源 代码 中 使 用 宏 的 时 候 ， 
宏 在 预 编译 处 理 期 间 会 被 蔡 换 为 其 蔡 换 列表 中 的 内 容 。 下 面 我 们 将 通过 
代码 清单 10-1 举 一 些 例子 来 初步 说 明 宏 的 定义 以 及 使 用 方式 。 








代码 清单 10-1 宏 的 初步 使 用 





#include <stdio.h> 











// 这 里 定义 了 一 个 缺 省 蔡 换 列表 的 宏 MY_MACRO 
#define MY_MACRO 























// 这 里 定义 了 一 个 宏 对 象 MY_MACRO1， 其 替换 列 表 为 : 100 
#define MY_MACROL1 100 




















// 这 里 定义 了 一 个 宏 对 象 MY_MACR02， 其 蔡 换 列表 为 : 10 + a 
#define MY_MACRO2 10 +a 


// 这 个 宏 对 象 直 接 定义 了 一 个 函数 

// 如 果 蔡 换 列 表 中 的 代码 较 长 ， 那 么 可 以 用 \ 后 面 紧 跟 换行 符 来 进行 换行 ， 
// 这 里 要 注意 的 是 ,，\ 后 面 不 应 该 再 跟 其 他 空白 符 ， 而 是 要 直接 紧 跟 换行 符 
#define MY_MACRO3 static int Foo(void) { \ 

return 1; \ 
















































































































































































// 这 里 使 用 了 宏 MY_MACR03， 因 此 在 预 处 理 期 间 ， 这 里 会 将 MY_MACRO03 扩 展 为 上 述 替换 列表 中 的 函数 定义 。 
// 所 以 这 里 使 用 MY_MACR03， 就 相当 于 安插 了 这 段 代码 : 

// static int Foo(void){returni;} 

MY_MACRO3 






























































// 这 里 定义 了 一 个 宏 函 数 MY_SWAP， 用 于 交换 两 个 实 参 的 值 。 
// 这 里 要 注意 ，MY_SWAP 与 (之 间 不 应 该 出 现 空 白 符 。 

// 这 里 假定 x 和 y 都 是 整数 类 型 
#define MY_SWAP(x, y) { int tmp = x; x = y; y= tmp; } 


















































static void Dummy(void) 








































































































{ 
// 这 里 MY de ey 而 不 是 函数 ， 
// 因为 MY_MACR04 与 (之 间 有 一 个 空格 (空白 符 ) 。 
/这 便 央 公信 全 了 (my 全 绑 的 突 人 霹 作 用 拒 内 
// 但 仍然 可 以 在 当前 文件 作用 域 中 任何 位 置 使 用 
#define MY_MACRO4 (a, b) 

} 

int main(int argc, const char * argv[]) 

{ 











// 在 预 处 理 期 间 ，MY_MACRO 的 蔡 换 不 包含 任何 预 处 理 符 号 ; 
// MY MACRO1 会 会 被 自动 蔡 换 为 100 
int a = MY_MACRO MY_MACRO1， 















































// 在 预 编 译 处 理 期 间 ，MY_MACR02 会 被 自动 替换 为 19 + al， 
// 因此 整个 表达 式 在 编译 前 会 变 为 ; intb=10+ax3 
int b = MY_MACRO2 * 3; 


























// 这 里 a 的 值 为 160，b 的 值 为 10 + a * 3 等 于 310 
printf("a = %d, b = %d\n", a, b); 




























































































// 这 里 直接 调用 了 Foo 函 数 ， 由 于 在 main 函 数 上 已 经 使 用 了 宏 MY_MACR0O3， 
// 所 以 它 在 预 处 理 阶段 扩展 后 ， 被 蔡 换 成 了 对 Foo 函 数 的 定义 
a = Foo( 


); 
printf("a = %d\n", a); 


























// 这 里 使 用 了 宏 函 数 MY_SWAP， 并 且 将 对 象 标识 符 a 和 b 作 为 其 实 参 传 入 
时 De OS 0 b ) 痊 换 为 以 下 代码。 

int b; 
RE 各 亿 可 以 到 ;得 本 后 请 没有 沃 加 有 号 ， 因 为 了 作为 复合 语句 结尾 时 分 号 可 省 
MY_SWAP(a，b) 
// 交换 之 后 a 的 值 为 10，b 的 值 为 1 
printf("a = %d, b = %d\n", a, b); 





































































































// 这 里 使 用 了 MY_MACR04 宏 对 象 ， 在 预 处 理 阶 段 进 行 扩 展 时 会 变 为 : a = (a，b); 
// 因此 ， 这 条 表达 式 语句 会 将 对 象 b 的 值 赋 给 对 象 a。 
// 此 外 ， 尽 管 MY_ MACRO4 定 义 在 了 Dummy 活 数 内 ， 但 仍然 可 以 在 main 函 数 中 使 ) 
a = MY_MACRO4; 


















































// 这 里 会 输出 OK 
if(a == b 
puts("OK!"); 


// 错误 的 宏 定 义 ， 在 # 符 号 之 前 不 允许 出 现 除 空白 符 之 外 的 任何 其 他 字符 
MY_MACRO #define ERROR_MACRO 















































// 以 下 宏 定 义 没 问题 ， 由 于 在 # 之 前 只 有 空白 符 。 
// # 与 define 之 间 允 许 存在 除了 换行 符 以 外 的 其 他 空白 符 
# define OK_MACRO 



































代码 清单 10-1 中 所 展示 的 宏 定义 与 宏 丛 换 尽管 不 算 复杂 ， 但 已 经 能 
充分 呈现 出 宏 定 义 的 形式 以 及 宏 普 换 后 的 代码 样式 。 正 如 本 书 第 一 章 所 
提 到 的 ，C 语 言 编译 器 在 对 C 源 代码 编译 前 需要 先 做 一 次 预 编译 ， 也 束 
是 预 处 理 。 在 预 编译 阶段 会 将 预 处 理 器 符号 全 都 符 换 为 它 所 定义 的 将 换 
列表 中 的 内 容 ， 同 时 合并 多 余 的 空白 符 。 在 代码 清单 10-1 中 我 们 可 以 看 
到 ， 在 瞧 换 过 程 中 ， 丛 换 列 表 中 的 任 一 符号 (除了 某 些 补 合 并 的 空白 符 
之 外 ) 都 会 得 到 保留 ， 且 原封 不 动 地 蔡 换 到 即将 编译 的 源 代码 中 。 











当然 ， 除 了 我 们 在 源 代码 中 显 式 定义 宏 之 外 ， 编 译 器 一 般 也 会 提供 


全 局 的 宏 定义 。 比 如 ， 当 我 们 在 使 用 GCC 或 Clang 编 译 器 时 ， 可 以 使 用 
编译 选项 -D， 后 面 紧 跟 所 要 定义 的 宏 名 ， 然 后 可 跟 = 来 指定 该 宏 的 替换 
列表 。 比 如 ，-DMY_MACRO=10 这 个 命令 选项 (command option) 指定 
了 定义 一 个 全 局 的 宏 MY_MACRO， 并 且 该 宏 的 替换 列表 为 一 个 常量 整 
数 10。 


10.1.2” 宏 定义 中 的 # 操 作答 


在 一 个 宏 函 数 定义 中 ， 如 果 在 丛 换 列表 中 使 用 # 后 面 跟 形 参 名 ， 那 
么 在 宏 蔡 换 时 可 以 将 此 形 参 部 分 所 对 应 的 实 参 内 容 以 字符 串 字 面 量 的 形 
式 表示 。 在 使 用 这 种 宏 函 数 时 ， 在 作为 实 参 的 预 处 理 符号 中 的 每 个 空白 
符 都 会 在 预 处 理 时 作为 字符 串 字 面 量 中 的 一 个 空格 符 。 在 实 参 中 ， 第 一 
个 预 处 理 符号 之 前 的 空白 符 以 及 预 处 理 符 号 之 后 的 空白 符 都 会 在 预 处 理 
时 被 删除 。 其 他 情况 下 ， 实 参 中 每 个 预 处 理 符 号 的 原始 拼写 都 会 保留 在 
宏 普 换 之 后 的 字符 串 字 面 量 中 ， 除 非 出 现 转 义 字 符 需 要 处 理 。 如 果 宏 普 
换 后 的 结果 不 是 一 个 有 效 的 字符 串 字 面 量 ， 那 么 结果 是 未 定义 的 。 








代码 清单 10-2 展 示 了 宏 定义 中 # 操 作 符 的 使 用 方法 以 及 效果 。 


代码 清单 10-2” 宏 定义 中 # 操 作 符 的 使 用 





#include <stdio.h> 
#include <string.h> 




















// 这 里 定义 了 一 个 简单 的 带 有 # 操 作 符 的 宏 MY_MACRO01。 
































// 这 里 # 与 Xx 之 间 有 一 个 空格 ， 这 是 合法 的 ， 并 且 与 #X 的 效果 一 致 
#define MY_MACRO1(X ) # xX 


































































































// 这 里 定 个 带 有 两 个 形 参 的 宏 函 数 ， 
// [着 措 询 表 是 将 加 | 个 实 参 所 指定 的 符号 作为 字符 串 字面 量 与 个 换行 符 拼接 ， 
// 然后 再 与 第 二 个 实 参 所 指定 的 符号 作为 字符 串 字 面 量 进 行 拼 接 
























































#define MY_MACRO2(x, y) #x "\n" #y 


int main(int argc, const char * argv[]) 











// 这 里 的 MY_MACRO1(19ab ) 会 被 蔡 换 为 "10ab" 
const char *s = MY_MACRO1(10ab); 
printf("The literal is: %s\n", s); 




















// 这 里 字符 串 比 较 结果 是 相同 的 
if(strcmp(s, "10ab") == 0) 
puts("Equal!"); 


// 对 于 # 操 作 符 所 作用 的 形 参 对 应 的 实 参 ， 其 前 后 空白 符 都 会 被 删除 ， 


// 同时 ， 这 里 的 \ 符 号 在 宏 蔡 换 为 字符 串 之 后 就 变 为 "NAN， 
S = MY_MACRO1( 10"abxn"” ); 





















































// 这 里 字符 串 比 较 结果 是 相同 的 
if(strcmp(s，"10N"ab\NnN"") == 0) 
puts("Equal!"); 


// 这 里 尽管 第 一 个 实 参 中 有 一 个 逗号 ， 但 它 被 包围 在 圆 括 号 中 ， 因 此 不 作为 实 参 分 隔 符 。 

// 同样 ， 在 第 二 个 参数 中 的 去 号 在 ， ' 中 ， 它 作为 一 个 字符 token， 因 此 也 不 作为 实 参 分 隔 符 。 
s = MY_MACRO2( (123abc, 45; '0'), [1a2b3c: 2 ;=])s 

printf("string is: %s\n", Ss); 


// 这 里 第 二 个 实 参 传 的 是 不 含 任何 预 处 理 符号 的 实 参 ， 这 里 仅 用 一 个 喜 号 作为 分 隔 符 。 
比 时 ，MY_MACRO2(abcd， ) 会 被 替换 为 "abcd\n"， 而 忽略 后 续 与 #y 的 替换 与 拼接 ， 

// 由 于 y 形 参 对 应 的 实 参 不 包含 任何 预 处 理 符 号 ， 因 此 它 用 占 位 标记 预 处 理 符号 代替 ， 

// 在 宏 蔡 换 的 最 后 阶段 # 与 占 位 标记 预 处 理 符号 的 拼接 被 完全 移 除 

s = MY_MACRO2(abcd, ); 

printf("s = %s\n", Ss); 


// 这 里 与 上 述 代码 类 似 ， 只 不 过 第 一 个 实 参 作为 不 含 任何 预 处 理 符号 的 实 参 ， 

// 这 里 仅 用 一 个 逗号 作为 参数 分 隔 符 使 用 。MY_MACR02(， abcd ) 这 里 会 被 替换 为 "\nabcd" 
Ss = MY_MACRO2(, abcd); 

printf("s = %s\n", s); 


// 以 下 宏 实 参 是 非法 的 ， 由 于 它 不 是 一 个 有 效 的 预 处 理 符号 ， 
/1 于 出 现 了 一 个 ，， 但 没有 找到 另 一 个 ' 与 之 匹配 
// s = MY_MACRO1(123'p); 
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代码 清单 10-2 详 细 描 述 了 宏 定 义 中 # 操 作 符 的 使 用 方式 。 这 里 还 引 
出 了 预 处 理 符 号 (preprocessing token〉 的 概念 。 我 们 可 以 看 到 ， 代 码 清 
蛙 10-2 中 在 main 函 数 中 作为 宏 的 实 参 的 符 写 (token)〉 非常 丰富 ， 诸 如 
10ab， 它 在 C 语 言 一 般 源 代码 中 压根 就 不 是 一 个 合法 的 标识 符 ， 也 不 是 
一 个 合法 的 数字 字面 量 ， 但 它 却 是 一 个 合法 的 预 处 理 符号 ， 因 此 可 以 作 











为 宏 函 数 的 实 参 。 


C 语 言 标准 规定 了 哪些 元 素 可 作为 预 处 理 符 号 ， 哪 些 不 能 。 下 面 列 
出 可 作为 预 处 理 符号 的 元 素 : 


Ss 
-标识 符 ; 


预 处 理 数字 ; 


所 有 非 空白 字符 ， 并 且 它 们 不 能 是 以 上 提 到 的 符号 


因此 ， 像 代码 清单 10-2 中 的 123p 就 不 是 一 个 有 效 的 预 处 理 符号 ， 因 
为 123P 既 不 是 一 个 合法 的 预 处 理 数字 ， 也 不 是 一 个 合法 的 字符 常量 ， 所 
以 在 ' 后 面 必须 再 要 出 现 一 个 '"， 以 至 于 能 构成 一 个 完整 的 合法 字符 常 
才 算 是 一 个 有 效 的 预 处 理 符号， 也 就 是 说 123'p' 束 是 一 个 合法 的 预 处 理 
符 写 了 。 而 像 123\p 这 种 也 不 属于 有 效 的 预 处 理 符号， 因 办 只 能 作为 字 
符 转 义 符号 使 用 ， 一 般 不 作为 他 用 。 如 果 宏 函数 实 参 中 含有 去 写 ， 那 么 
必须 注意 ， 应 该 要 用 圆 括 与 围 起 来 ， 人 耕 则 逗号 将 作为 实 参 分 隔 符 的 功能 








而 使 用 。 


此 外 ， 在 代码 清单 10-2 中 我 们 也 提 到 了 在 使 用 宏 函 数 时 传 入 缺 省 实 
参 的 形式 ， 比 如 MY_MACRO2 (abcd，) 以 及 MY_MACRO2 (， 
abcd) 。 此 时 ， 缺 省 的 宏 函 数 实 参 在 宏 人 痊 换 时 会 先 用 占 位 标记 了 预 处 理 符 
号 代 蔡 ， 然 后 与 它 前 后 其 他 预 处 理 符 号 进行 拼接 。 比 如 像 
MY_MACRO2 (abcd，) ， 在 宏 蔡 换 开 始 前 就 好 比 ; 
#abcd"\n"#placemarker; 在 替换 后 ， 却 lacemarker 将 被 完全 移 除 ， 所 以 结 
果 字 符 串 为 "abcd\n"。 


10.1.3” 宏 定义 中 的 检 操 作 符 


在 宏 函 数 定义 中 ， 如 果 在 蔡 换 列表 中 含有 检 操 作答 ， 并 且 挫 操作 符 
的 前 面 或 后 面 跟 一 个 该 宏 函 数 的 一 个 形 参 ， 那 么 在 宏 准 换 时 ， 该 形 参 用 
其 相应 实 参 的 预 处 理 符号 序列 进行 将 换 。 如 果 在 宏 痊 换 时 ， 相 应 的 实 参 
没有 预 处 理 符号 ， 那 么 形 参 将 用 一 个 “王位 标记 ” 预 处 理 符 号 进行 将 换 。 


简单 来 说 ， 检 操作 符 起 到 的 作用 是 将 宏 函 数 的 形 参 与 蔡 换 列表 中 的 
内 容 完 全 融合 起 来 。 比 如 说 ， 我 们 要 定义 一 个 宏 函 数 ， 使 得 该 形 参 能 与 
10 拼 接 在 一 起 ， 那 么 我 们 可 以 用 #define CONCAT (x) xi#10。 这 样 在 
宏 替 换 时 ， 相 应 实 参 所 对 应 的 预 处 理 符号 能 与 10 完 全 融 为 一 体 。 比 如 使 
用 CONCAT (32) 之 后 ， 它 就 会 被 蔡 换 为 3210。 一 个 占 位 标记 预 处 理 符 





号 与 一 个 非 占 位 标记 预 处 理 符号 的 拼接 ， 结 采 为 那个 非 占 位 标记 预 处 理 


A 


检 操 作 符 与 # 操 作 符 不 同 ， 拓 操作 符 不 仅 可 作用 于 宏 函 数 形 参 ， 而 
且 也 可 用 于 在 丛 换 列表 中 将 其 前 后 两 个 预 处 理 符 号 序列 拼接 在 一 起 。 因 
此 圩 操作 符 的 适用 范围 比 # 更 三，# 操 作 符 的 操作 数 只 能 是 宏 函 数 形 参 。 


代码 清单 10-3 展 示 了 二 操 作 符 的 一 些 基 本 用 法 。 


代码 清单 10-3” 宏 定义 中 的 并 操作 符 





#include <stdio.h> 

// 定义 了 一 个 宏 函 数 MY_MACRO1， 功 能 是 将 形 参 x 对 应 的 实 参 预 处 理 器 符号 序列 与 10 拼 接 在 一 起 
#define MY_MACRO1(X) X ## 10 

// 定义 了 一 个 宏 函 数 MY_MACRO2， 功 能 是 将 0x 与 形 参 X 对 应 的 实 参 预 处 理 器 符号 序列 拼接 在 一 起 
#define MY_MACRO2(X) OX ## X 

// 定义 了 一 个 宏 函 数 MY_MACR03， 功 能 是 将 形 参 x 对 应 的 实 参 预 处 理 器 符号 序列 与 10 拼 接 在 一 起 
// 后 面 再 加 上 将 9x 与 形 参 y 对 应 的 实 参 预 处 理 符号 序列 拼接 在 一 起 的 数 

#define MY_MACRO3(X，y) Xx##10 + 9X##y 
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// MY_MACR04 是 一 个 宏 对 象 ， 它 直接 表示 ++ 操 作 符 
#define MY_MACRO4 + ## 十 






































// 这 里 定义 了 宏 函 数 CONCAT， 将 Xx 与 y 对 应 的 实 参 预 处 理 符号 序列 拼接 在 一 起 
#define CONCAT(x, y) X ## y 














int main(int argc, const char * argv[]) 








// 这 里 的 MY_MACRO1(32) 将 被 蔡 换 为 3210 
int a = MY_MACRO1(32); 

// 这 里 将 打印 出 3210 

printf("a = %d\n", a); 


// 这 里 对 MY_MACR01 的 实 参 传递 不 包含 任何 预 处 理 符 号 的 实 参 序列 ， 
// 这 样 使 得 这 里 的 MY_MACR01 宏 函数 最 终 被 蔡 换 为 10， 

// 形 参 x 用 一 个 占 位 标记 预 处 理 符 代 蔡 。 
// 占 位 标记 预 处 理 符 与 10 〈 非 占 位 标记 预 处 理 符 ) 拼接， 结果 就 是 10 
a = MY_MACRO1( ) 

printf("a = %d\n", a); 


















































































































































// 这 里 的 MY_MACRO2(64) 将 被 蔡 换 为 0x64 
a = MY_MACRO2(64); 

// 这 里 将 打印 出 100 

printf("a = %d\n", a); 





























// 这 里 的 MY_MACR03(190，16 ) 将 被 蔡 换 为 19019 + 0x16 
a = MY_MACRO3(10, 16); 














// 这 里 将 打印 出 1032 
printf("a = %d\n", a); 








// 这 里 的 MY_MACR04 将 被 蔡 换 为 ++， 
// 因此 这 条 语句 就 相当 于 : a++， 














printf("a = %d\n", a); 








// ed 0bj ) 将 被 替换 为 anobj， 
// 从 而 这 里 声明 了 一 个 名 为 anobj 的 int 类 型 对 
int CONCAT(an, obj); 












































// 这 里 可 直接 引用 anobj 标 识 符 
anobj = a; 











代码 清单 10-3 展 示 了 检 操 作 符 的 典型 使 用 方式 。 我 们 上 面 已 经 讲解 
了 # 与 检 操 作 符 ， 并 且 讲 了 宏 的 基本 使 用 方式 。 下 面 我 们 将 进一步 讲解 
宏 蔡 换 ， 同 时 将 大 潜 作 符 与 寿 操 作 符 结合 起 来 进行 描述 





10.1.4” 宏 替换 


本 节 将 更 详细 地 摘 述 宏 普 换 。 首 先 ， 在 同一 文件 作用 域内 ， 不 能 
现 两 个 相同 名 称 的 宏 标 识 符 ， 除 非 这 两 个 宏 标 识 符 的 蔡 换 列表 完全 等 
同 。 也 就 是 说 相同 的 宏 定 义 可 以 出 现 多 次 。 





在 宏 定 义 中 ， 符 换 列 表 之 前 的 空白 符 以 及 蔡 换 列表 之 后 的 空白 符 全 
都 不 作为 丛 换 列表 中 的 一 部 分 
当 使 用 一 个 宏 时 ， 宏 实例 会 用 苦 换 列表 中 的 预 处 理 符 号 进行 将 换 ， 


完了 之 后 预 处 理 器 还 会 再 次 扫描 更 多 的 宏 名 。 也 就 是 说 ， 宏 定 义 钻 
可 以 引用 另外 一 个 已 定义 的 宏 ， 因 此 预 处 理 器 会 不 断 迭 代 解 析 蔡 换 列 表 


中 所 有 出 现 的 宏 ， 下 到 把 它们 全 都 解析 完成 。 当 预 处 理 喜 识别 到 使 用 一 
个 宏 函 数 时 ， 其 形 参 会 用 实 参 进行 伙 换 。 斩 换 列 表 中 的 形 参 耕 不 作为 
# 或 ## 的 操作 数 ) 在 该 宏 的 蔡 换 列表 中 所 包含 的 所 有 宏 名 全 都 被 扩展 之 
后 ， 才 用 相应 的 实 参 进行 蔡 换 。 在 做 实 参 蔡 换 之 前 ， 每 个 实 参 的 预 处 理 
从 写 需要 进行 完全 的 宏 丛 换 。 也 就 是 说 ， 宏 函数 的 蔡 换 顺序 是 先 处 理 丛 
换 列 表 中 出 现 的 # 与 棒 操 作 符 ， 然 后 对 蔡 换 列表 中 所 出 现 的 宏 进行 展开 
人 蔡 换 ， 接 着 检查 实 参 是 否 引用 了 宏 ， 如 果 引 用 了 则 先 对 所 有 引用 了 宏 的 
实 参 进行 完全 的 宏 蔡 换 ， 最 后 才 将 丛 换 列表 中 出 现 的 形 参 答 换 为 宏 扩 展 
后 的 实 参 对 应 的 预 处 理 符号 。 





在 对 宏 函 数 调 用 过 程 中 ， 当 蔡 换 列表 中 的 所 有 形 参 已 被 蔡 换 ， 并 且 
对 # 与 检 的 处 理 也 完成 之 后 ， 所 有 占 位 标记 预 处 理 符号 被 移 除 ， 然 后 所 
获得 的 预 处 理 符 号 序列 再 被 重新 扫描 。 


宏 定 义 与 国 数 定义 不 同 ， 不 能 做 “递归 式 ? 定 义 ， 也 就 是 次 在 一 个 宏 
的 蔡 换 列表 中 不 能 出 现 所 定义 宏 目 身 的 标识 符 ， 此 外 , “间接 递 归 式 ” 定 
义 也 不 行 ， 比 如 宏 A 的 丛 换 列表 中 引用 了 宏 B， 而 宏 B 的 瞧 换 列表 中 文 引 
用 了 宏 A。C 语 言 标准 指出 ， 发 生 以 上 这 两 种 情况 时 宏 名 不 会 被 葵 换 。 
这 些 没 被 蕉 换 的 宏 名 预 处 理 符号 对 于 后 续 的 蔡 换 也 不 再 可 用 。 








最 后 要 提 到 的 一 点 是 ， 如 果 在 宏 丛 换 之 后 ， 恰 好 出 现 了 诺 如 #define 
这 种 结果 ， 那 么 出 现 这 种 预 处 理 符 号 序列 不 会 作为 预 处 理 指示 符 进 行 处 
理 ， 即 便 它 是 一 个 “ 民 好 定义 的 ” 宏 ， 此 时 编译 器 (C 语 言 实 现 ) 也 会 报 


民 


代码 清单 10-4 进 一 步 描述 了 宏 蔡 换 的 操作 次 序 以 及 一 些 
地 方 。 


代码 清单 10-4 宏 蔡 换 的 进一步 描述 





#include <stdio.h> 














// 这 里 先 定义 一 个 宏 函 数 MY_MACRO1 
#define MY_MACRO1(X ) X+ x ## 0 

















// 这 里 定义 的 MY_MACR01 与 上 述 定义 的 完全 等 同 ， 因 此 是 允许 的 
#define MY_MACRO1(X) xXx+ x ## 0 






























































// 这 里 定义 LITERAL， 将 形 参 所 对 应 的 实 参 预 处 理 符号 序列 进行 字符 
#define LITERAL(X) #X 


ny 
由 
会 















































// 这 里 定义 宏 函 数 MY_MACRO2， 其 替换 列表 引用 了 宏 函 数 LITERAL 
#define MY_MACRO2(x) LITERAL (x) 


























// 这 里 定义 了 一 个 用 于 拼接 的 宏 函 数 CONCAT， 
// 它 将 x 与 y 所 对 应 的 实 参 预 处 理 符号 进行 拼接 ， 然后 再 拼接 一 个 ELLO 
#define CONCAT(x, y) X ## y ## ELLO 






































int main(void) 


{ 














// 这 里 ，MY_MACRO1(10 ) 会 被 替换 为 : 10 + 100 
int a = MY_MACRO1(10) 
printf("a = %d\n", a); 

















H 








// 这 里 是 对 宏 LITERAL 的 使 用 : LITERAL(MY_MACRO1(29 ) ) ， 

// 第 一 步 就 是 先 对 LITERAL 进 行 宏 蔡 换 ， 走 接 就 是 #x， 
由 于 对 # 操作 符 的 处 理 次 序 比 实 参 中 出 现 宏 名 进行 蔡 换 的 次 序 要 优先 ， 

// 所 以 这 里 的 第 1 步 完成 后 直接 做 第 2 步 ， 将 实 参 MY_MACRO1( 2 ) 苦 换 掉 形 参 x 

// 替换 后 相当 于 : # MY_MACRO1(20)， 因 此 最 后 的 替换 结果 就 是 字符 串 "MY_MACRO1(29)" 

const char *s = LITERAL(MY_MACRO1(20)); 

printf("s = %s\n", Ss); 
































































































































// 这 里 对 宏 MY_MACR02 的 使 用 ，MY_MACRO2(MY_MACRO1(20 ) )， 

// 第 一 步 先 对 MY_MACR0O2 进 行 宏 蔡 换 ， 结果 为 LITERAL (x)， 由 于 这 里 不 涉及 
// # 与 ## 操作 符 ， 然而 却 存在 宏 名 LITERAL， 因此 需要 进一步 对 它 扩 展 。 
// 所 以 第 二 步 就 是 宏 展开 LITERAL (Xx)， 得 到 #X 
// 这 里 需要 大 家 注意 ， 由 于 这 里 的 #x 不 是 MY_ MACRO2 宏 里 的 蔡 换 列 表 中 的 ， 
// 而 是 被 蔡 获 扩展 出 来 的 ， 对 此 此 时 不 需要 直接 对 # 符号 做 处 理 。 
// 所 以 第 三 步 就 是 对 实 参 中 出 现 的 宏 MY_ MACRO1 进 行 夫 换 。 

// 对 实 参 MY_MACR0O1(20 ) 进 行 宏 替 换 后 结果 为 20 + 200， 

// 然后 第 四 步 将 扩展 后 的 实 参 20 + 200 传 给 形 参 Xx， 得 : #<20 + 200>。 
// 最 终 获 得 字符 串 字 面 量 一 "290 + 200" 
Ss = MY_MACRO2(MY_MACRO1(20)); 
printf("s = %s\n", s); 
















































































































































































































































































// 下 面 这 个 对 CONCAT 的 使 结果 会 蔡 换 为 : #define ELLO， 
// 使 得 宏 痊 换 结 果 为 一 个 预 编译 指示 符 ， 这 会 导致 编译 报错 。 
CONCAT(##， define) 























#define def 100 
#define H abcd 
































// 这 里 对 宏 MY_MACR02 的 使 用 与 上 述 类 似 ， 
// 第 一 步 先 对 MY _MACRO2 进 行 宏 普 换 ， 结果 为 LITERAL(X ); 
第 二 
入 
































// 是 再 对 LITERAL 进 行 宏 展开 ， 得 到 #x; 
// 0 def H) 进 行 宏 蔡 换 ， 














// 得 到 : x ## y ## ELLO 
// 由 于 这 里 CONCAT 宏 的 蔡 失 列 表 含有 ## 操 作 符 ， 
// 因此 不 会 对 实 参 宏 def 和 行 扩 展 ， 
// 所 以 第 四 步 将 实 参 if 和 def H 符 换 形 参 之 后 ， 结 果 为 ]fdef HELLO ; 
// 第 五 步 将 扩展 后 的 实 参 传 给 形 参 x， 得 : #<ifdef HELLO> ; 

XI 最 终 歼 得 字符 串 字 面 量 一 "ifdef HELLO" 

s = MY _MACRO2( CONCAT (if, def H)); 

printf("s = %s\n", Ss); 








































































































代码 清单 10-4 详 细 介 绍 了 宏 蔡 换 的 操作 步骤 ， 相 信 读 者 读 到 这 里 已 
经 对 宏 定义 与 宏 替 换 有 了 更 深层 的 理解 了 。 此 代码 中 的 某 些 注释 中 含有 
#<> 的 符号 ， 这 里 的 <> 表 示 将 其 中 的 预 处 理 器 符号 作为 一 个 整体 ， 比 如 
#<ifdef HELLO>， 表 示 将 ifdef HELLO 预 处 理 符 号 序列 作为 整体 蔡 换 掉 


形 参 。 人 否则 下 fdef HELLO 的 语义 跟 #<ifdef HELLO> 是 不 一 样 的 。 








10.1.5 ”可 变 参 数 的 宏 定 义 


从 C99 标 准 起 ，C 语 言 开始 加 入 了 不 定 参 数 个 数 〈 义 称 可 变 参数 ) 
的 宏 定义 。 与 可 变 参 数 的 函数 类 似 ， 定 义 可 变 参 数 的 宏 函 数 时 ， 宏 的 形 
参 列 表 使 用 .… 来 表示 。 而 在 蔡 换 列表 中 ， 用 _VA_ARGS_ _〔 前 后 各 有 
两 条 下 划 线 ) 表示 形 参 ... 对 应 的 参数 内 容 。 比 如 : #define 
VARIADIC_MACRO (...) printf (” VA_ARGS_) 。 这 里 将 
VARIADIC_MACRO 宏 定义 为 printf 函 数 ， 同 时 可 变 参数 部 分 用 


_VA_ARGS_ 表示 。 在 使 用 可 变 参 数 宏 的 时 候 ，… 所 对 应 的 实 参 列 表 
将 完全 等 同 地 取代 替换 列表 中 的 _VA_ARGS_ 部 分 。 比 如 ， 如 果 我 们 
使 用 上 述 定 义 的 VARIADIC_MACRO (“The integer is: %d\n”， 

100) ; ， 那 么 在 做 宏 玲 换 之 后 就 成 为 printf (“The integer is: %d\n”， 
100) ; 。 


这 里 各 位 要 当心 的 是 ， 一 般 我 们 在 定义 可 变 参数 宏 的 时 候 ， 参 数列 
表 直 接 使 用 〈…) ， 而 不 是 在 它 前 面 再 加 某 个 形 参 ， 比 如 : #define 
VARIADIC_PRINT (str，...) print (strt，_VA_ARGS__) 这 种 形式 。 
由 于 ... 部 分 的 可 变形 参 可 以 不 传 任何 实 参与 之 对 应 ， 比 如 
VARIADIC_PRINT (“Hello”)〉; 像 这 个 宏 在 做 宏 蔡 换 时 会 变 为 : 








printf (“Hello”，) ; 。 请 大 家 注意 ， 在 实 参 “Hello” 后 面 还 有 一 个 去 
号 ! 因为 _VA_ARGS_ 表示 的 是 .部 分 ， 在 蔡 换 列表 print 〈str， 
_VA_ ARGS ) 中 , 在 _VA_ARGS_ 之 前 有 一 个 逗号 作为 printf 函 数 
的 实 参 分 隔 符 。 但 是 蔡 换 列表 在 预 处 理 阶 段 不 会 解析 此 语义 ， 预 处 理 器 
只 会 解析 宏 本 身 的 参数 分 隔 符 ( 比 如 : VARIADIC_PRINT (str，...) 中 
的 带 写 作为 其 形 参 分 隔 符 〉。 所 以 在 宏 痊 换 之 后 ， VA_ARGS_ 之 前 
的 喜 号 仍然 保留 ， 而 这 就 会 导致 编译 错误 。 在 使 用 宏 的 时 候 可 传 缺 省 的 
实 参 内 容 ， 但 在 函数 调用 的 时 候 却 不 能 这 么 做 ， 函 数 调用 中 每 个 实 参 过 
号 分 隔 符 后 必须 跟 一 个 对 应 的 表达 式 作为 实 参 。 








代码 清单 10-5 展 示 了 可 变 参 数 宏 的 一 些 用 法 。 


代码 清单 10-5 ”可 释 参 数 宏 定义 与 使 用 





#include <stdio.h> 


/A 

* 定义 了 带 有 可 变 参 数 的 宏 VARIADIC_MACRO1， 

* 其 蔡 换 列表 是 将 整个 实 参 列表 内 容 作为 字符 串 字 国 
* 然后 与 "The string is: "进行 拼接 

* 

/ 

#define VARIADIC MACRO1(...) "The string is: " # VA ARGS _ 

































































| 
ul 
































* 定义 了 带 有 可 变 参 数 的 宏 VARIADIC_MACR02， 

* 其 替换 列表 是 将 实 参 列表 与 100 结 合 ， 然 后 用 ( ) 包 围 起 来 

*/ 
#define VARIADIC_ MACRO2(...) (_ VA ARGS _ ## 100) 












































pA 

* 定义 ] 有 两 个 形 参 的 宏 VARIADIC_MACR03， 其 第 二 个 形 参 为 可 变 参数 ; 

其 答 换 列表 是 先 执行 多 参 a 对 应 的 表达 式 ， 然 后 执行 可 变 实 参 列 表 ， 最 后 放 表 达 式 10。 
* 它们 用 ( ) 包 围 起 来 

*/ 

#define VARIADIC MACRO3(a, ...) (a _ VA ARGS 10) 





























































































































int main(void) 


{ 














// 这 里 VARIADIC_MACRO1(Good luck! ) 将 会 被 替换 为 : 
// "The string is: " "Good luck!" 

const char *s = VARIADIC MACRO1(Good luck!); 
// 输出 : The string is: Good luck! 


你 7 定 
printf("s = %s\n", s); 

















// 这 里 实 参 列表 Say "Hi"!，Byebye，Thank you 作 为 一 个 整体 ， 

// 然后 通 ; 过 # 操 作 符 被 替换 为 "Say \"Hi\"!,， Byebye, Thank you" 
S = VARIADIC_MACRO1(Say "Hi"!, Byebye Thank you); 

// 输 出 : S The string is: say "Hi"!, Byebye, Thank you 
printf("s = %s\n", Ss); 



































// 这 里 使 用 VARIADIC_MACRO1 宏 的 时 候 没 有 传 任何 实 参 

4 因此 宏 蔡 换 后 就 是 "The string is: "这 单一 的 字符 
= VARIADIC MACRO1(); 

// 输 出 : s = The string is: 

printf("s = %s\n", Ss); 

















Ud 














tu 























// 这 里 VARIADIC_MACR02(20) 将 被 替换 为 : (20100) 
int a = VARIADIC_MACRO2(20); 

// 输出 : a = 20100 

printf("a = %d\n", a); 











// 这 里 VARIADIC_MACRO2(10，20，30) 将 被 蔡 换 为 : (10，20，30100)， 
// _ 很 明显 它 是 一 个 逗号 表达 式 。 而 整 条 语句 为 : a = (10, 20, 30100); 

a = VARIADIC_ MACRO2(10, 20, 30); 

// 输出 : a = 30100 

printf("a = %d\n", a); 











int b = 0; 














// 这 里 VARIADIC_MACRO3(++b，-20 + ) 将 被 替换 为 : (++b - 20 + 10)， 
// 其 中 第 一 个 实 参 为 t+b， 后 面 的 -29 + 作为 可 变 参数 的 实 参 

a = VARIADIC EN -20 + ); 

// 输出 : a 三 -9, BA 二 

printf("a = %d, b = i. a, b); 



































// 这 里 缺 省 VARIADIC_MACR03 的 第 一 个 实 参 ， 可 变 实 参 部 分 为 30 * ， 
// 因此 VARIADIC_MACR03(，30 * ) 被 蔡 换 为 : (30 * 10) 

a = VARIADIC MACRO3(, 30 * ); 

// 输出 : a = 300 

printf("a = %d\n", a); 





























// 这 里 同时 缺 省 了 第 一 个 实 参 以 及 可 变 参数 列表 的 实 参 ， 
// 因此 VARIADIC_MACR03( ， ) 被 蔡 换 为 : (10) 

a = VARIADIC MACRO3( ， ); 

// 输出 : a = 10 

printf("a = %d\n", a); 
































代码 清单 10-5 中 我 们 可 以 清晰 地 看 到 ， 在 使 用 可 变 参 数 宏 时 ， 可 变 
形 参 对 应 的 实 参 是 连同 实 参 喜 号 分 隅 符 一 同 换 入 蔡 换 列表 中 去 的 ， 取 代 
_VA_ARGS_ 部分。 在 蔡 换 完 之 后 ， 如 采 表 达 式 有 语法 错误 则 会 编译 
报错 ， 蔡 换 列 表 在 预 编 译 时 是 不 做 语法 分 析 的 。 








10.2 CC 语言 中 预定 义 的 宏 


C 语 言 标准 指出 了 C 语 言 实现 〈 即 C 语 言 编译 工具 ) 要 求 必 须 实现 的 
预定 义 宏 以 及 可 选 实现 的 预定 义 宏 。 所 谓 预 定义 宏 即 不 是 由 C 语 言 程 序 
员 自 己 定义 ， 而 是 由 编译 工具 预先 已 经 定义 好 的 宏 。 








C 语 言 中 的 预定 义 宏 分 为 三 类 : 


C 语 言 标准 强制 要 求 预定 义 的 宏 ; 


环境 宏 ， 它 可 选 实现 的 预定 义 宏 ; 





条件 特征 宏 ， 这 也 是 实现 可 选 实现 的 。 





当然 除 此 之 外 ，C 语 言 实 现 可 根据 当前 平台 环境 等 因素 目 己 定义 特 
定 的 预定 义 宏 。 





10.2.1 “C 语 言 强 制 要 求 的 预定 义 安 


我 们 在 写 C 语 言 代码 的 时 候 出 于 调试 或 备注 的 目的 ， 往 往 想 方便 获 
得 当前 C 语 言 源 文件 名 、 当 前 代码 所 在 的 行 号 、 当 前 代码 所 在 的 函数 
名 、 编 译 当 前 源 文件 时 的 时 间 日 期 等 。 因 此 ，C 语 言 标准 提供 了 以 下 我 
们 常用 的 预定 义 宏 来 方便 地 获取 这 些 信 息 。 




















1) _DATE_: 此 预定 义 宏 用 于 表示 当前 日 期 的 一 个 字符 串 字 面 
量 ， 其 形式 为 "Mmm dd yyyy"。 这 里 ，Mmm 是 月 份 的 缩写 ， 比 如 1 月 是 
Jan，2 月 是 Feb。 如 果 日 小 于 10， 那 么 前 面 的 一 个 d 用 一 个 空格 字符 表 
示 。 所 以 ， 如 果 是 2015 年 2 月 6 日 ，_DATE ”就 表示 为 "Feb 22015"， 这 
里 Feb 与 2 之 间 有 两 个 空格 。 


2) _FILE_: 表示 当前 源 文件 名 ， 用 字符 串 字 面 量 表示 。 


3) _LINE ”_: 表示 当前 源 文件 的 当前 行 号 ， 用 一 个 整数 常量 


4) _STDC_: 它 表示 一 个 常量 值 ， 如 果 该 宏 的 值 为 1， 那 么 说 明 


当前 C 语 言 实 现 顺 应 C 语 言 标 准 。 











5) _STDC_HOSTED_: 如 果 当 前 C 语 言 实现 是 一 个 主机 并 实现 ， 
那么 该 预定 义 宏 的 值 为 1;， 如果 是 独立 式 实现 ， 那 么 该 预定 义 宏 的 值 为 
0。 所 谓 主机 端 实 现 是 指 当前 C 源 代码 最 终 编译 为 当前 目标 平台 兼容 的 二 
进 制 代 码 文 件 ， 随 后 可 以 连接 成 能 在 当前 目标 平台 上 可 直接 执行 的 可 执 
行文 件 。 而 独立 式 实现 类 则 比较 灵活 ， 比 如 可 以 将 当前 C 源 代码 编译 为 
一 种 中 间 人 代码， 然后 可 以 以 虚拟 机 的 方式 对 该 中 间 代 码 做 解释 执行 。 








6) _STDC_VERSION_: 该 预定 义 宏 表示 一 个 整数 常量 (long 类 
型 ) ， 用 于 指明 当前 正 使 用 的 C 语 言 标准 版 本 。 比 如 ， 如 果 当 前 用 的 是 


2011 年 12 月 发 布 的 C 语 言 标准 ， 那 么 整数 常量 为 201112L。 


7) _TIME。_: 表示 当前 时 间 的 一 个 字符 串 字 面 量 ， 其 形式 


为 "hh: mm: ss"。 比 如 ，22 时 55 分 30 秒 则 表示 为 "22: 55: 30"。 





除了 上 述 这 些 预 定义 宏 之 外 ， 从 C99 标 准 起 规定 ，C 语 言 实现 还 需 
要 实现 一 个 预定 义 标 识 符 _func ”， 该 预定 义 标识 符 表 示 当 前 函数 名 ， 


它 被 定义 为 : static const char func []="function-name"; 


代码 清单 10-6 展 示 了 使 用 上 述 这 些 宏 的 示例 。 


代码 清单 10-6 ”C 语 言 强 制 要 求 预 定义 的 宏 





#include <stdio.h> 
int main(void) 


printf("The current date is: %s\n", _ DATE  ); 


printf("The current time: %s\n", __TIME  ); 

printf("The current file is: %s\n', __FILE  ); 

printf("The current function: %s\n'", func  ); 

printf("The current line is: %d\n", _ LINE  ); 

printf("The current standard is: %ld\n", __STDC_VERSION  ); 
printf("Conform standard C %d\n", __STDC_  ); 

printf("Is current hosted environment: %d\n", STDC_HOSTED__ ); 








此 外 ，C 语 言 标准 还 强制 规定 了 不 能 预 定义 _cplusplus 该 预定 义 
宏 ， 如 果 此 宏和 被 预定 义 ， 那 么 说 明 当 前 编译 环境 为 C++ 语言 ， 而 不 是 C 


请 
lll 


12 环境 灾 


环境 宏 主 要 用 于 指明 当前 源 文件 输入 字符 编码 的 文 持 情况 。 这 些 宏 
都 是 可 选 实现 ， 而 不 是 必须 实现 的 。 





1) _STDC_ISO_10646。_: 该 预定 义 宏 被 定义 为 一 个 整数 常量 ， 形 
式 与 _STDC_VERSION_ 类 似 。 如 果 遵 循 的 [SO10464 是 1997 年 12 月 发 
布 的 ， 那 么 此 宏 的 值 为 199712L。 如 果 C 语 言 实现 定义 了 这 个 宏 ， 那 么 
在 wchar t 类 型 对 象 中 存放 的 值 ， 在 Unicode 要 求 字 符 集 中 的 每 一 个 
Unicode 与 该 字符 所 对 应 的 短 标识 符 具 有 相同 的 值 。Unicode 要 求 字符 集 
由 ISO/EC 10646 定 义 的 所 有 字符 组 成 ， 此 外 还 包括 一 些 修 改 与 技术 勘 
误 表 。 如 果 C 语 言 实现 使 用 了 其 他 编码 方式 ， 那 么 就 不 能 定义 此 宏 。 





2) _STDC MB MIGHT _NEQ WC _: 如 果 该 预定 义 宏 的 值 为 1， 
那么 指明 当 在 一 个 整数 字符 各 量 中 用 作为 单个 字符 时 ，wchar _t 类 型 的 


字符 编码 中 ， 一 些 基本 字符 集 的 编码 值 不 需要 与 其 值 相等 。 





3) _STDC_UTF_16”_: 如 果 该 预定 义 宏 的 整数 和 常量 值 为 7， 那么 
旨 明 char16 t 类 型 的 值 表示 的 是 UTF16 编 码 的 。 如 果 C 语 言 实现 对 
char16_t 类 型 的 值 采用 的 是 其 他 编码 类 型 ， 那 么 就 不 该 定义 此 宏 。 


4) _STDC_UTF_32 _: 如 果 该 预定 义 宏 的 整数 常量 值 为 1， 那 么 
指明 char32_t 类 型 的 值 是 UTF-32 编 码 的 。 如 果 C 语 言 实现 对 char32_t 类 型 
的 值 采 用 的 是 其 他 编码 方式 ， 那 么 就 不 该 定义 此 宏 。 


10.2.3 条件 特征 安 





C 语 言 标准 中 含有 一 些 语 法 特征 古 C 语 言 编译 器 可 选 实现 的 ， 编 主 
名 可 根据 这 些 宏 来 指明 自己 是 否 文 持 C 语 言 中 的 一 些 可 选 实现 的 语法 特 
人 











1) _ STDC_ANALYZABLE。_: 如 果 该 预定 义 宏 的 整数 常量 值 为 
1， 那 么 指明 当前 C 语 言 实现 顺从 C 语 言 标准 在 附录 工 中标 出 的 运行 时 代 
码 检查 ， 这 些 代 和 码 检 查 主要 包括 数组 边界 是 否 越界 、 栈 是 否 越界 等 。 








2) _STDC_IEC_559”: 如 果 该 预定 义 宏 的 整数 和 常量 值 为 1， 那 么 
指明 当前 C 语 言 实现 顺 从 C 语 言 标 准 中 附录 F 中 标 出 的 浮 点 数 表 示 以 及 浮 
点 算术 运算 。 





3) _STDC IEC 559 COMPLEX _: 如 果 该 整数 常量 值 为 7， 那么 
指明 当前 C 语 言 实现 遵守 C11 标 准 手册 附录 G 中 的 规格 说 明 (ISO/IEC 
60559 兼 容 的 复数 ) 。 





4) _ STDC_LIB EXT1 : 如 果 该 预定 义 宏 被 定义 ， 那 么 它 是 一 个 
整数 常量 ， 形 式 与 “STDC_ VERSION 类似， 用 于 指明 当前 C 语 言 实现 
支持 C11 标 准 中 附录 K 定 义 的 扩展 (主要 是 边界 检查 接口 )。 


5) _STDC_NO_ATOMICS _: 如 果 该 预定 义 宏 的 整数 常量 值 为 


1， 那 么 指明 当前 C 语 言 实现 不 文 持 原子 类 型 (包括 _Atomic 类 型 标识 
符 ) 以 及 <stdatomic.h> 头 文件 。 


6) _STDC_NO_COMPLEX_: 如 果 该 预定 义 宏 的 整数 常量 值 为 
1， 那 么 指明 当前 C 语 言 实 现 不 文 持 复数 类 型 ， 并 且 也 不 文 持 

<complex.h> 头 文件 。 如 果 C 语 言 实现 定义 了 此 宏 ， 那 么 当前 实现 就 不 该 
定义 _STDC_IEC_559_COMPLEX_ 这 个 宏 。 


是 ，C 语 言 标准 中 没 次 有 了 此 预定 义 宏 就 不 文 持 _Thread local， 这 个 天 
键 字 仍然 可 以 被 文 持 。 





7) _STDC_NO_THREADS 。_: 如 果 该 预定 义 宏 的 整数 常量 值 为 
1， 那 么 指明 当前 C 语 言 实现 不 文 持 <threads.h> 头 文件 。 这 里 要 注意 的 


8) _STDC_ NO_VLA_: 如 果 该 预定 义 宏 的 整数 常量 值 为 1， 那 么 
指明 当前 C 语 言 实现 不 支持 变 长 数组 ， 也 不 支持 可 变 修改 类 型 。 





10.2.4 主流 编译 器 及 平台 预定 义 的 安 


用 的 处 理 器 架构 等 。 


以 下 预定 义 宏 不 是 C 语 言 标准 指出 的 ， 而 是 当前 主流 桌面 平台 
理 霹 及 主流 编译 需 可 能 文 持 的 预定 义 宏 。 我 们 通过 这 些 宏 可 以 了 解 到 当 
不 


口 、 处 
前 所 用 的 是 哪 亚 C 语 言 编译 器 ， 以 及 当前 编译 目标 环境 所 在 的 系统 与 所 


1) _MSC_VER: 如 果 C 语 言 实现 预定 义 了 这 个 宏 ， 说 明 当 前 的 编 
译 器 为 MSVC。 


2) GNUC_: 如 果 C 语 言 实现 预定 义 了 这 个 宏 ， 说 明 当 前 的 编译 
器 为 GCC 或 兼容 GCC 的 编译 器 。 那 么 ， 如 果 我 们 在 使 用 Clang 编 译 器 
时 ， 此 宏 也 是 被 定义 的 。 


3) _dlang _: 如 果 C 语 言 实现 预定 义 了 这 个 宏 ， 说 明 当 前 的 编译 
器 为 Clang 编 译 器 。 

4) ”i386”: 如 果 C 语 言 实 现 预 定义 了 这 个 宏 ， 说明 编 译 生成 的 目 
标 为 32 位 的 x86 处 理 器 。 


5) ”x86_64 ”: 如 果 C 语 言 实现 预定 义 了 这 个 宏 ， 说 明 编 译 生 成 的 
目标 为 x86_64 处 理 器 ， 并 运行 在 64 位 系统 模式 下 的 指令 集 。 


6) _ arm ”: 如 果 C 语 言 实现 预定 义 了 这 个 宏 ， 说 明 编 译 生 成 的 目 
标 为 32 位 ARM 处 理 器 。 


7) arm64 : 如 果 C 语 言 实 现 预 定义 了 这 de 说 明 编 译 生 成 的 
目标 为 64 位 的 ARM 处 理 器 


8) APPLE _: 如 果 C 语 言 实 现 预 定义 了 这 个 宏 ， 说 明 编 译 生 成 
的 目标 为 Apple 系 统 (包括 macOS、iOS、tvOS、watchOS 等 ) 上 的 。 


9) _ unix : 如 果 C 语 言 实现 预定 义 了 这 个 宏 ， 说 明 编 译 生 成 的 目 
标 是 Unix 或 与 其 兼容 的 系统 上 的 。 


10) _linux _: 如 果 C 语 言 实现 预 定义 了 这 个 宏 ， 说 明 编 译 生成 的 
目标 是 Linux 或 与 其 兼容 的 系统 上 的 。 


11) _WIN32: 如 果 C 语 言 实 现 预 定义 了 这 个 宏 ， 说明 编 译 生 成 的 目 
标 是 32 位 Windows 系 统 。 


12) _WIN64: 如 果 C 语 言 实 现 预 定义 了 这 个 宏 ， 说明 编 译 生 成 的 目 
标 是 64 位 Windows 系 统 。 


13) _LP64_: 如 果 C 语 言 实 现 预定 义 了 这 个 宏 并 且 其 整数 常量 大 
1， 那 么 说 明 当 前 程序 运行 环境 为 64 位 系统 环境 ， 此 时 long int 类 型 的 长 
度 为 64 位 ，int 类 型 的 长 度 仍 然 为 32 位 。 





10.3 条 件 预 编 译 


条 件 预 编译 用 来 控制 所 要 编译 的 代码 。 妆 条 件 预 编译 中 的 条 件 为 真 
时 ， 这 段 预 编译 块 中 的 代码 参与 编译 ， 否 则 不 参与 编译 。 实 际 上 ， 当 条 
件 预 编译 的 条 件 为 真 时 ， 预 处 理 嚣 才 会 将 该 预 编译 块 中 的 预 处 理 字符 序 
列 蔡 换 到 源 代 码 中 ， 等 待 后 续 编 译 。 


控制 条 件 包含 的 表达 式 应 该 是 一 个 整数 和 常量 表达 式 ， 此 外 还 支持 
defined 表 达 式 。defined 表 达 式 的 形式 类 似 于 sizeof 表 达 式 ， 有 两 种 形 
式 : 





def ined 标识 符 





以 及 
def ined ( 标识 符 ) 


defined 表 达 式 只 能 与 ##f 条 件 包含 控制 语句 联合 起 来 使 用 ， 而 不 能 
独 用 于 其 他 场合 。defined 后 面 的 标识 符 应 该 是 一 个 宏 名 ， 如 果 该 宏 在 此 
前 已 被 定义 ， 那 么 defined 表 达 式 的 值 为 1， 人 否则 defined 表 达 陈 的 值 为 0。 





在 预 处 理 常 量 表达 式 中 ，defined 表 达 式 可 以 参与 算术 逻辑 运算 ， 而 
且 像 ! defined 也 用 得 比较 多 ， 如 果 ! defined 后 面 的 标识 符 定义 过 ， 那 么 


表达 式 的 值 为 0， 否 则 表达 式 的 值 为 1。 这 里 的 ! 符号 相当 于 逻辑 运算 中 
的 非 操 作 符 。 


下 面 介 绍 划 f、#elif 预 处 理 指示 符 ， 这 两 个 预 处 理 指示 符 的 形式 都 一 








#if 常量 表达 式 换行 符 
条 件 预 编译 组 可 选 

#elif 常量 表达 式 换行 符 
条 件 预 编译 组 可 选 





























在 上 面 的 描述 中 ，“#if 常 量 表达 式 ” 以 及 “#elif 常 量 表 达 式 ”后 面 必须 
跟 一 个 换行 符 ， 而 不 能 用 其 他 符号 作为 分 隔 符 。 它 们 用 于 检查 控制 常量 
表达 式 计算 结果 是 否 为 非 零 。 如 果 #f 后 面 的 常量 表达 式 的 计算 结果 不 为 
零 ， 那 么 后 面 将 编译 该 条 件 预 编译 组 的 代码 。 如 果 李 {f 后 面 的 常量 表达 式 
的 计算 结果 为 零 ， 且 后 面 跟 有 #elif 语 句 ， 那 么 判定 #elif 语 句 后 面 的 常量 
表达 式 ， 如 果 计 算 结 果 不 为 零 ， 那 么 后 面 将 编译 该 条 件 预 编译 组 的 代 
码 。#elif 的 语义 类 似 于 else 让 ， 只 不 过 在 预 处 理 器 中 的 #else 后 面 不 能 跟 
任何 其 他 表达 式 和 语句 ， 只 能 跟 换行 ， 再 跟 条 件 预 编译 组 。 所 以 ，#elif 
也 可 以 用 下 述 语句 代 蔡 : 














#else 换行 符 
#if 常量 表达 式 换行 符 
条 件 预 编译 组 可 选 














这 里 的 “常量 表达 式 ” 应 该 是 一 个 有 效 的 、 适 用 于 预 处 理 的 常量 表达 
式 。 当 本 组 条 件 预 编译 组 的 条 件 包括 判定 都 结束 之 后 ， 最 后 必须 用 


#endif 来 结尾 。 其 中 ，#endif 后 面 只 能 跟 换行 符 ， 而 不 能 跟 其 他 字符 。 


此 外 ， 如 果 李 f、#elif 后 面 的 常量 表达 式 中 包含 一 个 标识 符 〈 在 预 处 
理 嚣 中 就 是 宏 ) ， 并 且 该 标识 符 在 此 时 没有 被 定义 ， 那 么 此 条 件 包 含 的 
判定 结果 即 为 “ 假 > 其 下 面 的 条 件 预 编 译 组 的 代码 不 会 参与 编译 。 


代码 清单 10-7 展 示 了 上 述 儿 个 控制 条 件 包含 语句 的 使 用 方式 。 


代码 清单 10-7 ##f、#elif、#else 预 处 理 指 示 符 的 使 用 





#include <stdio.h> 


int main(void) 























// 这 里 3 + 5 是 一 个 非 零 整数 常量 表达 式 ， 
// 因此 下 面 预 编译 组 的 puts 函 数 调用 表达 式 将 被 编译 

















































































































































































































#if 3 + 5 
puts("Non-zero expression"); 
#endif 
// 这 里 做 一 次 puts 函 数 调用 ， 而 实 参 内 容 则 根据 预 编译 条 件 来 选 
puts( 
// 这 里 #if 后 面 的 表达 式 为 0， 因 此 不 会 将 "9" 编译 进去 
#if 0 
oO" 
// 这 里 #e1lif 后 面 的 整数 常量 表达 式 结果 为 0， 因 此 后 面 的 "1" 不 会 编译 进去 
#elif 3 - 3 
ba 
// 由 于 上 述 条 件 判 定 均 失败 ， 所 以 编译 #else 下 面 的 预 编译 组 ，"2" 
#else 
Wp 
#endif 
); // 因此 这 里 将 输出 2 



































// 这 里 定义 了 宏 HELLO 
#define HELLO 
















































































// 这 里 判定 的 是 倘若 定义 了 HELLO 这 个 宏 ， 则 编译 下 面 的 puts 函 数 调用 。 
// 显然 ， 这 里 将 会 输出 HELLO defined 





#if defined(HELLO) 
puts("HELLO defined!"); 
#endif 





























这 里 判定 的 是 倘若 定义 了 HELLO 这 个 宏 ， 同 时 也 定义 了 HI 安 ， 

// 则 编译 下 面 的 puts 函 数 调 用 。 

// 显然 ， 这 里 的 puts 函 数 调用 不 会 被 编译 

#if defined(HELLO) && defined(HI) 
puts("Both defined"); 

#endif 
























































// 这 里 定义 了 宏 HI， 并 将 该 宏 的 值 定义 为 2 
#define HI 2 





























// 这 里 判定 的 是 倘若 定义 了 HELLO 这 个 宏 ， 同 时 也 定义 了 HI 宏 ， 

// 并 且 两 个 defined 表 达 式 的 值 加 起 来 等 于 HI 的 值 时 ， 则 编译 下 面 的 puts 函 数 调用 。 
// 显然 ， defined 表 达 式 的 值 均 为 1， 因 为 这 两 个 宏 此 时 都 被 定义 。 
// 同时 ，HI 的 值 被 定义 为 了 2， 因 此 条 件 完全 满足 ， 下 面 的 printf 函 数 调用 将 被 编译 

#if defined(HELLO) && defined(HI) && (defined(HELLO) + defined(HI)) == HI 















































































































































// 这 里 输出 : HI value: 2 
printf("HI value: %d\n", HI); 


#endif 
int aa = 100; 


// 这 里 大 家 要 注意 ， 由 于 上 面 定义 的 aa 不 是 预 处 理 中 定义 的 宏 ， 因 此 在 预 处 理 中 找 不 到 该 标识 符 ， 
// 因此 这 里 由 于 找 不 到 aa 标识 符 ，#if 条 件 不 成 立 ， 输 出 : aa is not defined! 
#if aa == 100 
puts("aa is defined!")， 
#else 
puts("aa is not defined!"); 
#endif 


































































































#define aa 20 


// 由 于 此 时 定义 了 aa 宏 ， 并 且 其 替换 列表 的 整数 常量 表达 式 确 实 为 20， 所 以 这 里 输出 Yep 
#if aa == 20 

puts("Yep!"); 
#endif 


// 这 里 将 输出 aa = 20， 因 为 aa 宏 定义 将 之 前 的 aa 对 象 标 识 符 给 覆盖 掉 了 
printf("aa = %d\n", aa); 

























































































enum 
MY_ENUM1, 
MY_ENUM2, 
MY_ENUM3 
}; 


























// 对 于 枚 举 符 而 言 ， 它 也 不 属于 预定 义 标 识 符 ， 因 此 下 面 将 输出 : MY_ENUM2 is not defined! 
#if MY_ENUM2 == 1 
puts("MY_ENUM2 is defined!"),; 
#else 
puts("MY_ENUM2 is not defined!"); 
#endif 
// 以 下 预 编译 i 吾 句 会 发 生 预 处 理 错误 ! 由 于 sizeof 操 作 符 只 能 用 于 C 代 码 的 编译 期 间 ， 
// 而 不 g 用 于 预 处 理 期 间 ， 对 此 sizeof(int ) 是 一 个 非法 的 预 处 理 常 量 表 达 式 























































































































#if aa == sizeof(int) 
puts("Yep!"); 

#endif 

} 





除了 上 述 介 绍 的 扒 f{、#elif 与 #else 这 些 条 件 包含 预 处 理 指示 符 之 外 ， 
还 有 扩 fdef 与 析 fndef 表 示 条 件 包含 的 预 处 理 指 示 符 。##fdef 类 似 于 #f 
defined 的 简略 表达 方式 ， 不 过 ##ifdef 后 面 只 能 跟 标 识 符 ( 即 宏 名 ) ， 而 


不 能 是 常量 表达 式 。 而 检 fndef 则 类 似 于 ##f! defined 的 简略 表达 方式 ， 不 
过 #ifndef 后 面 也 只 能 跟 标 识 符 ， 而 不 能 跟 常 量 表达 式 。 





代码 清单 10-8 将 利用 这 些 条 件 包含 预 处 理 与 10.2 节 中 列 出 的 C 语 言 
实现 可 选 预 定义 宏 相 结合 ， 给 出 当前 C 语 言 实现 与 运行 环境 所 提供 的 语 
言 特 性 与 系统 特征 。 














代码 清单 10-8 条件 包含 预 处 理 与 C 语 言 实现 预 定义 宏 





#include <stdio,h> 
int main(void) 


{ 
#ifdef __GNUC _ 

puts("GNU C or compatible compiler!"); 
#endif 


#ifdef _ clang _ 
puts("Current compiler is Clang!"); 
#endif 


#ifdef _MSC_VER 
puts("Current compiler is Microsoft Visual C!"); 
#endif 


#if defined(_ i386 ) || defined( x86 64 ) 
puts("x86 processor!"); 

#elif defined( arm ) || defined(_ arm64 ) 
puts("ARM processor"); 

#endif 


#ifdef _ APPLE _ 
puts("Apple Inc. 0S"); 

#elif defined(_ WIN32) || defined(_ WIN64) 
puts("Windows 0S"); 

#endif 


#ifdef _ unix _ 
puts("Unix or compatible 0S"); 
#endif 


#ifdef _ linux _ 
puts("Linux or compatible 0S"); 
#endif 


#ifdef __ LP64 _ 
puts("long type is 64-bit!"),; 
#endif 


// 相当 于 #if __STDC_ANALYZABLE  != 0 
#if __ STDC ANALYZABLE 





puts("C Analyzability available!"); 














#endif 
// 相当 于 #if __STDC_ISO_10646 I= 0 
#ifdef __STDC_ISO_10646 
printf("ISO 10646 %1d supported!\n", STDC_ISO 10646  ); 
#endif 
// 相当 于 #if __STDC_UTF_16 I= 0 








#if _ STDC_UTF_16 
puts("UTF-16 supported!"); 








#endif 

#if STDC_UTF_32 != 0 
puts("UTF-32 supported!"); 

#endif 


#if STDC_IEC_559 == 
puts("ISO/IEC 559 comformed!"); 
#endif 





#if __STDC_NO_ATOMICS _ == 
puts("Atomics not available!"); 
#endif 


#if __STDC_NO_THREADS _ == 
puts("<threads.h> not available!"); 

#endif 

} 


ee | 


10.4 源 文 件 包含 预 处 理 指 示 符 





C 语 言 是 一 个 可 共享 的 编程 语言 ， 我 们 可 以 将 自己 的 源 代码 编译 成 
库 ， 然 后 给 其 他 开发 人 员 使 用 。 这 样 ， 一 来 可 以 对 自己 的 源 代码 进行 保 
护 ， 因 为 库 中 的 代码 已 经 全 都 转 为 了 平台 相关 的 机 器 指 令 码 ， 二 来 也 不 
影响 其 他 开发 者 对 库 中 的 函数 接口 进行 调用 。 那 么 我 们 如 何 将 目 己 源码 
中 的 对 外 函数 接口 以 及 数据 类 型 等 共享 给 其 他 开发 者 呢 ? 答案 加 是 通过 
头 文件 (header) ! 


ull 








C 语 言 中 的 头 文件 一 般 以 .h 作 为 后 缀 名 ， 而 且 C 语 言 编译 器 一 般 不 会 
对 .h 文 件 进行 编译 ， 而 .hn 头 文件 中 的 代码 如 果 存 在 语法 错误 ， 则 往往 是 
在 包含 进 源 文 件 参与 编译 后 由 编译 器 发 现 的 。 在 C 语 言 预 处 理 中 使 用 
#include 预 处 理 指 示 符 将 指定 的 文件 包含 到 当前 源 文 件 中 。 





#include 有 两 种 形式 ， 一 种 是 : 





#include < 头 文件 名 > 换行 符 


还 有 一 种 是 : 








#include “ 头 文 件 名 ” 换行 符 





第 一 种 使 用 <> 的 形式 会 使 得 预 处 理 器 将 <> 中 所 指定 文件 的 整个 内 


容 将 大 nclude< 头 文件 名 > 这 整个 预 处 理 指示 符 全 都 蔡 换 掉 。 其 中 ， 对 <> 
中 指定 的 文件 路 径 的 搜索 是 实现 目 定义 的 。 对 于 主流 桌面 系统 而 言 ，<> 
中 指定 的 文件 路 径 一 般 就 是 操作 系统 默认 人 存放 库 头 文件 的 系统 路 径 或 是 
由 用 户 指 定 的 系统 环境 路 径 。 








而 第 二 种» 的 方式 是 由 实现 先 通过 为 一 种 自 定 义 的 搜索 方式 对 指定 
文件 进行 搜索 ， 如 果 搜 索 到 则 进行 内 容 答 换 ， 倘 各 搜索 不 到 ， 则 换 用 <> 
形式 的 搜索 方式 进行 搜索 ， 如 果 再 搜索 不 到 ， 则 会 出 现 编译 出 错 。 这 里 
所 谓 的 “ 另 一 种 实现 目 定义 搜索 方式 ”， 对 于 主流 桌面 系统 而 言 通 常 就 是 
当前 C 语 言 项 目 工程 下 的 路 径 。 








在 具体 实践 上 通常 来 说 ， 对 于 系统 自 带头 文件 ， 包 括 C 语 言 标 准 库 
的 头 文件 都 会 放置 在 每 个 操作 系统 的 指定 位 置 ， 我 们 可 以 直接 用 <> 的 方 
式 ; 忆 外 ， 我 们 通过 设置 当前 C 语 言 项 目 工程 的 默认 头 文 件 搜索 路 径 ， 
也 可 以 用 <> 的 形式 来 包含 指定 搜索 路 径 下 的 头 文件 ， 而 对 于 我 们 自己 写 
的 头 文件 ， 一 般 直 接 放 在 当前 C 语 言 工 程 项 目 中 ， 我 们 可 采用 “的 方式 
包含 。 束 如 上 面 所 提 到 的 那样 ， 使 用 的 方式 包含 尖 文 件 ， 其 搜索 范围 
比 用 <> 的 形式 来 得 广 。 














此 外 ，#include 后 面 可 以 跟 一 个 宏 名 ， 我 们 可 以 用 一 个 宏 对 象 来 指 
定 所 要 包含 的 文件 名 。 代 码 清单 10-9 展 示 了 对 机 nclude 预 处 理 指 示 符 的 
使 用 方法 与 作用 。 


代码 清单 10-9”##include 预 处 理 指示 符 的 使 用 与 效果 























/** 以 下 是 自己 写 的 al.h 头 文件 里 的 内 容 : */ 


// 这 里 使 用 条 件 预 编译 是 为 了 防止 此 头 文件 被 某 一 源 文件 多 次 包含 
#ifndef ai_h 
#define ai_h 

































































#include <stdio.h> 
#define MY_MACRO 100 
struct MyStruct 
int a; 
float f; 
}; 
static void MyFunction(struct MyStruct s) 


printf("The value is: %f\n", s.a + S.f); 


#endif /* ai h */ 


/xx 以 下 是 main.c 源 文件 内 容 */ 


// 由 于 a1.h 中 已经 包含 了 了 <stdio.h>， 因此 这 里 可 以 不 用 包含 
#include "ai.h" 

















































































































// 这 里 即便 再 次 包含 al1.h 也 没有 问题 ， 由 于 al.h 中 已 经 通过 条 件 预 编译 进行 了 重复 包含 的 保护 
#include "ai.h" 























int main(void) 
printf("The macro value is: %d\n", MY_MACRO); 
Struct MyStruct s = { 10, 1.5f }; 


MyFunction(s); 





在 代码 清单 10-9 中 分 别 列 出 了 al.h 头 文件 与 main.c 源 文件 中 的 代 
码 。 在 main.c 源 文件 中 ， 使 用 了 #include“al.h” 之 后 ， 其 实 是 将 整个 al.h 
头 文件 中 的 内 容 全 都 包含 到 了 main.c 文 件 中 的 #include"“al.h” 位 置 处 。 
此 在 两 句 源 文件 包含 的 预 处 理 完成 之 后 ， 整 个 main.c 的 内 容 是 这 样 的 : 





#define ai_h 


#include <stdio.h> 
#define MY_MACRO 100 
struct MyStruct 
int a; 
float f; 
/ 
static void MyFunction(struct MyStruct s) 


printf("The value is: %f\n", s.a + S.f); 


int main(void) 
printf("The macro value is: %d\n", MY_MACRO); 
Struct MyStruct s = { 10, 1.5f }; 


MyFunction(s); 





我 们 看 到 ， 当 包含 了 al.h 头 文件 之 后 ， 在 main.c 源 文件 的 翻译 单元 
中 自动 就 定义 了 al_h 以 及 MY_MACRO 这 两 个 宏 。 在 main.c 中 ， 当 遇 到 
第 2 条 ##include“al.h” 时 ， 由 于 al_h 宏 已 经 被 定义 ， 因 此 其 后 续 内 容 都 不 
会 被 再 次 包含 到 main.c 源 文件 中 。 


然后 我 们 再 看 代码 清单 10-10， 拓 nclude 加 宏 名 的 使 用 场合 。 


代码 清单 10-10 ”在 ##incude 预 处 理 指示 符 后 跟 宏 名 


























/** 以 下 是 自己 写 的 al.h 头 文件 里 的 内 容 : */ 


// 这 里 使 用 条 件 预 编译 是 为 了 防止 此 头 文件 被 某 一 源 文件 多 次 包含 
#ifndef adl_h 
#define ai_h 
























































#include <stdio.h> 
#define MY_MACRO 100 
struct MyStruct 

int a; 


float f; 
}; 


static void MyFunction(struct MyStruct s) 


printf("The value is: %f\n", s.a + S.f); 


#endif /* al_h */ 



































/** 以 下 是 自己 写 的 a2 .h 头 文件 里 的 内 容 : */ 


// 这 里 使 用 条 件 预 编译 是 为 了 防止 此 头 文件 被 某 一 源 文件 多 次 包含 
#ifndef a2_h 
#define a2_h 















































#define MY_MACRO -10 


struct MyStruct 


Short s; 
double dd; 
}; 
static void MyFunction(struct MyStruct s) 
{ 
} 


#endif /* a2_h */ 


/xx 以 下 是 main,c 源 文件 中 的 内 容 */ 


#include <stdio.h> 




















// 这 里 先 定义 一 个 USE_A2_HEADER 安 
#define USE_A2_HEADER 








// 以 下 条 件 预 编译 判别 的 是 :如果 定 义 了 USE_A2_HEADER 宏 ， 
// 那么 将 HEADER_NAME 定 义 为 "a2.h"; 否则 ， 将 HEADER_NAME 定 义 为 "a1l.h" 
#ifdef USE_A2_HEADER 





#define HEADER_NAME "a2.h" 
#else 
#define HEADER_NAME "ai.h" 
#endif 



































// 这 里 通过 HEADER_NAME 所 定义 的 头 文件 名 进行 包含 
// 当前 包含 的 是 "a2 .hy" 
#include HEADER_NAME 

















int main(void) 
printf("The macro value is: %d\n", MY_MACRO); 
Struct MyStruct s = { 10, 1.5f }; 


MyFunction(s); 





在 main.c 中 ， 一 开始 定义 了 宏 USE_A2 HEADER， 因 此 


HEADER_NAME 宏 所 指定 的 是 “a2.h”， 如 果 我 们 把 #define 
USE_A2_HEADER 注 释 挤 ， 那 么 包含 的 将 是 “al.h”。 


10.5”#error 了 预 处 理 指示 符 


#error 预 处 理 指示 符 用 于 在 预 处 理 过 程 中 报 出 指定 的 错误 诊断 信 
恩 。 其 形式 为 : 























#error ， 预 处 理 符号 可 选 ”换行 符 





如 果 源 文件 中 含有 #error 预 处 理 指示 符 ， 并 且 它 发 生 人 作用， 那么 编 
译名 就 会 报 #error 后 面 指定 预 处 理 符号 信息 字样 的 错误 。 如 代码 清单 10- 


11 所 示 。 


代码 清单 10-11 ”#error 预 处 理 指示 符 





// #define MY_SAFE_ MACRO 


#ifndef MY_SAFE_MACRO 

// 如 果 MY_SAFE_MACR0 没 有 被 定义 ， 那 么 这 里 就 会 报错 ， 显 示 : safe macro not defined! 
#error safe macro not defined! 

#endif 


// 这 里 直接 报错 ， 但 不 输出 错误 信息 
#error 



























































int main(void) 


} 





代码 清单 10-11 中 ， 先 把 MY_SAFE_MACRO 宏 定义 给 屏蔽 掉 ， 所 以 
在 编译 整个 源 代码 时 会 报错 误 信 息 。 一 般 #error 与 条 件 预 编译 一 起 使 用 
的 场合 较 多 。 


此 外 ， 有 些 编译 器 还 文 持 #Wwarning， 其 用 法 与 #error 一 样 ， 只 不 过 
编译 器 输出 的 是 警告 信息 ， 而 不 阻碍 编译 器 继续 编译 。 


10.6 ”要 ine 预 处 理 指示 符 


夫 ine 预 处 理 指示 符 用 于 作为 行 写 控 制 。 其 形式 为 : 





#1ine ”数字 序列 换行 符 








胡 ine 后 面 的 数字 即 指定 它 下 一 行 的 行 号 。 使 用 圾 ine 预 处 理 指示 符 ， 
预 处 理 器 在 计算 行 号 时 就 以 它 作为 基准 开始 算 ， 而 忽略 在 该 预 处 理 指示 


符 之 前 的 行 号 状态 。 


此 外 ， 雪 ine 还 有 一 种 形式 可 用 来 修改 当前 的 源 文件 名 : 





#1ine 数字 序列 “ 源 文件 名 ” 换行 符 








这 样 ， 除 了 当前 行 号 ， 连 源 文件 名 都 能 一 起 被 修改 。 代 码 清单 10- 
12 展 示 了 要 ine 预 处 理 指示 符 的 使 用 方式 以 及 效果 。 


代码 清单 10-12 ” 圾 ine 预 处 理 指 示 符 的 使 用 与 效果 





#include <stdio.h> 
int main(void) 
#1line 10 


printf("The current line is: %d\n", _ LINE ); 
// 上 面 输出 : The current line is: 10 






































printf("The current line is: %d\n"，_ LINE _); // 这 里 输出 13 


#line 100 "hello.cc" 
printf("The current line: %d, and file name: %s\n", __LINE , 
_FILE ); 
// 上 面 输出 : The current line: 100, and file name: hello.cc 




















10.7 #undef 预 处 理 指示 稚 





#undef 预 处 理 指 示 符 用 于 取消 之 前 定义 过 的 宏 。 其 形式 为 : 





#undef 标识 符 换行 符 








这 里 的 标识 符 就 表示 一 个 宏 名 。 如 采 加 ndef 后 面 的 宏 名 之 前 没 被 定 
义 过 也 没关系 ， 预 处 理 器 不 会 报错 。 如 果 #undef 后 面 的 宏 名 之 前 被 定义 
过 ， 那 么 之 前 定义 的 宏 束 被 撤销 。 代 码 消 单 10-13 展 示 了 #undef 的 使 用 与 
效果 。 





代码 清单 10-13”#undef 的 使 用 与 效果 





#include <stdio.h> 


#define MY_MACRO 100 

















// 这 里 使 用 #undef 将 MY_MACRO 宏 取消 定义 
#undef MY_MACRO 



































// 随后 这 里 再 重新 定义 MY_MACRO 宏 
#define MY_MACRO 200 








int main(void) 

















// 这 里 将 会 输出 200 
printf("MY_MACRO value is: %d\n", MY_MACRO); 





// 即便 没有 定义 过 YOUR_MACR0 宏 ， 放 在 #undef 后 也 没 问 题 
#undef YOUR_MACRO 





// 再 次 取消 定义 MY_MACRO 
#undef MY_MACRO 


#ifndef MY_MACRO 
/ 这 里 编译 器 会 报警 : MY_MACRO not defined! 
#warning MY_MACRO not defined! 
#endif 
} 


























代码 清单 10-13 演 示 了 加 ndef 的 使 用 ， 通 过 这 段 代 码 我 们 可 以 清晰 地 
了 解 到 #undef 将 一 个 指定 宏 给 取消 定义 的 效果 。 这 里 大 家 要 注意 的 是 ， 
对 于 一 个 宏 ， 只 有 当 它 被 取消 定义 之 后 才能 给 它 重 新 定义 一 个 准 换 列 
表 。 














一 


10.8 ”pragma 预 编译 指示 符 与 操作 符 








#pragma 预 处 理 指示 符 用 于 指示 当前 翻译 单元 使 用 东 种 编译 特性 进 
行 编译 。 比 如 ， 可 以 指定 哪些 函数 用 茶 个 优化 选项 进行 优化 ， 从 哪里 开 
始 使 用 标准 序 点 约定 等 。 其 形式 为 : 























#pragma ” 预 处 理 符号 ”换行 符 





这 里 ， 预 处 理 符 号 就 是 pragma 指 定 的 编译 选项 ， 这 些 编译 选项 一 般 
由 编译 器 实现 自己 定义 。 当 然 ，C 语 言 标 准 也 列 出 了 若干 标准 的 编译 选 
项 ， 以 STDC 作 为 前 级 ， 其 形式 为 : 








#pragma STDC 标准 支持 的 编译 选项 开关 值 ”换行 符 











这 里 ， 开 关 值 有 三 种 ， 分 别 是 : ON、OFEF 与 DEFAULT。 


除了 加 ragma 预 处 理 指示 符 外 ，C 语 言 标准 从 C99 开 始 引 入 了 


_Pragma 操 作 符 。 


_Pragma 操 作 符 的 语义 与 #pragma 预 处 理 指 示 符 一 样 ， 只 不 过 它 更 为 
灵活 ， 可 用 于 宏 定 义 的 蔡 换 列表 中 ， 而 元 ragma 预 处 理 指示 符 则 不 能 。 
_Pragma 操 作 符 的 形式 为 : 




















_Pragma ( 字符 串 字面 量 ) 

















它 后 面 可 以 直接 跟 函 数 、 结 构 体 类 型 等 元 素 的 定义 。 人 代码 清单 10- 
介绍 了 #pragma 预 处 理 指示 符 与 _Pragma 操 作 符 的 使 用 。 


代码 清单 10-14 ”#pragma 预 处 理 指示 符 与 _Pragma 操 作 符 的 使 用 





#include <stdio.h> : Es 
// 这 里 使 用 #pragma 预 处 理 指示 符 开 启 遵循 浮 点 数 标准 的 编译 选项 
#pragma STDC FP_CONTRACT ON 


// 指示 后 面 的 代码 用 -02 优 化 选项 进行 优化 
#pragma 02 













































































static void MyFunc(int a) 


a += 100; 
printf("a = %d\n", a); 











// 指示 后 面 的 代码 用 -00 优 化 选项 编译 
#pragma 00 























// 这 里 根据 当前 编译 器 是 否 预 定义 了 DEBUG 宏 来 指示 MY_PRAGMA_O0PTION 宏 的 状态 。 
// 如 果 预 定义 了 DEBUG 宏 ， 那 么 MY_PRAGMA_0PTION 宏 用 -00 的 编译 选项 ; 

// 否则 使 用 -02 的 编译 选项 

#ifdef DEBUG 


























#define MY_PRAGMA OPTION _Pragma("00") 
#else 
#define MY_PRAGMA OPTION _Pragma("02") 
#endif 


MY_PRAGMA_OPTION 
static int MyFunc2(int a, int b) 


return a*a+b™* b; 


} 
// 指示 从 main 函 数 开始 的 代码 用 -01 优 化 选项 编译 


_Pragma("01") int main(void) 




















MyFunc(10); 


int value = MyFunc2(3, 4); 
printf("The value is: %d\n", value); 





通过 代码 清单 10-14， 我 们 可 以 看 到 利用 条 件 预 编译 与 _Pragma 操 作 
符 的 结合 使 用 能 非常 方便 地 通过 当前 环境 上 下 文 来 指定 自己 需要 的 编译 
选项 。 








10.9 空 指示 符 与 C 语 言 中 的 程序 注释 


预 处 理 指示 符 中 的 空 指 示 符 比较 简单 ， 形 式 为 : 





# 换行 符 








# 与 换行 符 之 间 可 以 存在 空白 待 。 它 在 实际 代码 中 没有 任何 效果 。 
有 时 在 写 一 连 毕 预 处 理 指示 符 时 ， 添 加 一 些 空 指示 符 可 能 会 使 得 代码 格 
式 更 好 看 一 些 。 代 码 清单 10-15 展 示 了 空 指示 符 的 一 般 使 用 。 


代码 清单 10-15” 空 指示 符 的 使 用 





#include <stdio.h> 

# 

#ifdef HELLO 

#warning HELLO is defined 
#end 


# 
#define HELLO 100 
# 


int main(void) 


printf("HELLO = %d\n", HELLO); 





下 面 主要 谈论 C 语 言 的 注释 。 对 于 程序 代码 来 说 ， 注 释 的 重要 性 不 
言 而 喻 ， 无 论 是 给 自己 的 编程 思路 留 个 注解 还 是 给 其 他 人 看 源码 ， 这 些 
一 般 都 需要 注释 加 以 辅助 。 我 们 之 前 的 所 有 代码 示例 中 几乎 都 含有 注 
释 ， 用 于 说明 当前 语句 的 作用 以 及 效 末 。 在 计算 机 编程 语言 中 ， 注 释 
Ccomment) 是 不 参与 编译 的 ， 而 只 是 作为 描述 性 的 文字 片段 。 注 释 可 








以 用 来 描述 当前 源 代 码 主要 实现 什么 功能 ， 描 述 函 数 实现 什么 功能 ， 结 
构 体 、 联 合体 等 用 户 自 定义 类 型 表示 什么 含义 等 。 





在 C11 标 准 中 ， 注 释 有 两 种 形式 ， 第 一 种 是 行 注 释 ， 在 一 行 代码 中 
只 要 不 是 出 现在 或 ?内 的 /符号 ， 一 直到 这 一 行 的 换行 符 ， 都 属于 注释 
部 分 。 从 下 一 行 开始 则 不 属于 注释 部 分 ， 而 是 正式 的 代码 部 分 。 男 一 种 
古语 句 块 注释 ， 从 出 现 不 包含 在 Y 或 “内 的 * 符 号 开始 一 直到 */ 结 束 痢 属 
于 注释 部 分 。* 到 */ 之 间 可 以 存在 多 个 换行 符 。 











了 Ht 





在 C 语 言 中 ， 如 果 出 现 注释 ， 那 么 C 语 言 实现 在 预 处 理 阶 段 就 会 去 
掉 它 所 过 到 的 注释 行 和 注释 段 ， 一 般 会 用 一 个 空白 符 来 代 丛 ， 不 过 C 语 
言 标准 也 没有 其 体 指定 用 什么 符 写 去 蔡 换 整个 注释 行 与 注释 段 ， 但 是 对 
于 C 语 言 程序 员 来 说 ， 需 要 将 注释 看 作 代码 中 的 一 个 空白 符 。 代 码 清 单 
10-16 展 示 了 注释 的 一 些 用 法 以 及 效果 。 


代码 清单 10-16 注释 的 使 用 与 效果 





#include <stdio.h> 
#include <stdbool.h> 


/* 这 是 一 个 注释 段 ， ee ; 
可 以 用 来 大 篇 幅 地 介绍 当前 源 文件 、 函 数 等 功能 描述 。 
wh 





















































#define MY_LITERAL (expr) #expr 


int main(void) // 这 是 一 个 注释 行 ， 可 以 用 来 描述 某 句 代码 表示 什么 含义 
{ 
































const char *s = "// 这 不 是 一 个 注释 ， 而 是 一 个 字符 串 " 
printf("s = %s，%c\n"，sS，'// '); // '// 也 不 是 一 个 注释 ， 而 是 一 个 字符 常量 











int var = 100 























// 下 面 这 句 是 错误 的 ， 这 里 并 不 是 var += 100， 而 是 被 看 作为 V ar += 100 
#if false 
v/* 这 里 用 注释 隔断 */ar += 100; 
































#endif 














s = MY_LITERAL(you/* 这 里 用 注释 隔断 */win ); 






































// 这 里 将 输出 : you win。 这 两 个 单词 中 间 用 




















printf("var = %d, s = %s\n", var, Ss); 


// 如 果 在 一 个 行 注释 中 出 现 /*， 那 么 Ee i 4 








个 空格 隔断 。 





























// 而 不 起 到 注释 段 开头 的 作用 。 所 以 后 和 再 









































全 yh 如 果 在 注释 段 中 出 现 //， 那 么 它 


























起 无 
出 被 政大 全 














效 的 
释 内 容 的 一 部 分 ， 也 不 青 








充当 





注 





释 行 的 7 





Tf 头 





代码 清单 10-16 展 示 了 比 以 往 更 多 形式 的 注释 ， 以 及 注释 在 代码 中 
注释 段 被 Clang 


扮演 的 作用 。 我 们 在 代码 清单 10-16 中 可 以 清楚 地 看 到 ， 
空格 符 。 


编译 器 在 预 处 理 时 转 为 了 一 个 


10.10 ”本章 小 结 


本 章 介 绍 了 C 语 言 预 处 理 器 的 所 有 特性 ， 展 示 了 C 语 言 强 大 的 宏 功 
能 以 及 条 件 预 编译 等 高 效 、 灵 活 的 特性 。 通 过 将 宏 、 条 件 预 编译 、 
pragma 等 组 合 使 用 ， 可 使 得 C 语 言 代码 更 具 路 平台 性 、 可 移植 性 以 及 紧 
凑 性 。 当 然 ， 对 宏 的 滥用 也 可 能 导致 程序 调试 的 不 便捷 ， 所 以 设计 宏 的 


时 候 需 要 小 心 谨慎 。 








此 外 ， 本 章 对 C 语 言 的 注释 做 了 进一步 详细 介绍 ， 描 述 了 注释 的 作 
用 以 及 在 代码 中 的 使 用 效果 。 通 过 本 章 的 学 习 ， 大 家 可 以 写 出 更 丰富 、 
更 “专业 ”的 C 语 言 程序 代码 。 





第 11 章 C 语 言 程序 的 编译 上 下 文 


本 章 将 为 大 家 介绍 C 语 言 中 的 编译 上 下 文 相关 话题 。 其 中 包括 对 
象 、 沙 数 以 及 类 型 标识 符 的 作用 域 和 名 字 空 间 ， 对 象 与 函数 的 连接 以 及 
对 象 的 生命 周期 。 由 于 在 编程 语言 中 ， 对 数据 对 象 的 管理 、 函 数 接口 的 
抽象 化 在 维护 较 大 项 目 工程 的 时 候 会 显得 非常 重要 ， 因 此 通过 学 习 本 
革 ， 我 们 可 以 将 自己 写 的 C 语 言 程序 中 的 函数 、 对 象 、 类 型 进行 更 好 地 
安排 ， 使 得 我 们 的 程序 或 库 有 着 更 加 良好 的 封装 性 ， 同 时 也 能 使 代码 写 
得 更 安全 、 健 壮 。 








11.1 C 语 言 程 序 中 的 作用 域 和 名 字 空 间 





C 语 言 程序 中 ， 一 个 标识 符 〈identifier) 可 用 来 表示 一 个 对 象 ， 函 
数 ， 结 构 体 、 联 合体 以 及 枚 举 的 名 称 或 是 它们 的 成 员 《〈 枚 举 的 成 员 又 被 
称 为 枚 举 常 量 ) ，typedef 名 〈13.4 节 将 会 详细 描述 ) ， 跳 转 标签 名 ， 宏 
名 ， 或 是 一 个 宏 形 参 。 同 一 个 标识 符 在 程序 中 的 不 同位 置 可 能 会 表示 不 
同 的 实体 ， 也 就 是 说 在 C 语 言 中 ， 标 识 符 允 许 被 覆盖 。 





对 于 一 个 标识 符 所 指 代 的 每 个 不 同 的 实体 ， 只 有 在 一 个 程序 文本 的 
区 域内 ， 该 标识 符 才 是 “可 见 的 "， 这 个 区 域 就 被 称 为 作用 域 (scope) 。 
如 果 某 个 标识 符 同时 指 代 了 多 个 不 同 的 实体 ， 那 么 这 些 实体 要 么 具有 不 
同 的 作用 域 ， 要 么 在 不 同 的 名 字 空 间 中 。C 语 言 一 共有 4 种 作用 域 ， 分 别 
是 : 函数 作用 域 、 文 件 作 用 域 、 语 句 块 作用 域 以 及 函数 原型 作用 域 。 下 
面 ， 我 们 将 分 别 介 绍 这 4 种 作用 域 。 








11.1.1 文件 作用 域 








在 C 语 言 标准 中 ， 对 具有 文件 作用 域 的 标识 符 的 定义 非常 有 意思 ， 
用 的 是 排除 法 一 一 如 果 一 个 标识 符 声 明 在 所 有 语句 块 之 外 ， 同 时 也 在 形 
参 列 表 之 外 ， 那 么 我 们 称 该 标识 符 具 有 文件 作用 域 。 文 件 作用 域 从 当前 
源 文 件 开 始 一 直到 源 文件 末尾 结 











这 里 有 几 个 非常 典型 的 例子 。 如 果 读 者 学 过 Java、C++ 等 面 问 对 象 
的 编程 语言 ， 那 么 应 该 知道 这 些 编程 语言 中 的 类 可 以 肉 套 定义 类 ， 并 且 
在 套 类 的 作用 域 属于 其 外 部 类 。C 语 言 也 能 在 结构 体 或 联合 体 中 髓 套 定 
义 结构 体 或 联合 体 ， 但 蔡 套 定义 的 结构 体 和 联合 体 具 有 与 其 外 部 结构 体 
或 联合 体 同等 的 作用 域 。 也 就 是 说 ， 如 果 定 义 的 外 部 结构 体 在 文件 作用 
域 中 ， 那 么 其 内 部 授 套 定义 的 结构 体 也 处 于 文件 作用 域 中 。 同 样 ， 定 义 
在 文件 作用 域 的 枚 举 类 型 中 的 枚 举 闸 量 也 具有 文件 作用 域 。 在 C 语 言 
中 ， 结 构 体 、 联 合体 与 枚 举 定义 块 本 里 不 具有 “作用 域 * 属 性 ， 它 们 不 属 
于 语句 块 。 




















此 外 ， 对 于 预 处 理 器 中 的 宏 、 条 件 预 编译 等 指示 符 ， 它 们 始终 具有 
文件 作用 域 ， 而 不 受 其 他 作用 域 的 影响 (参见 第 10 章 的 介绍 ) 。 代 码 清 
单 11-1 展 示 了 有 具有 文件 作用 域 的 标识 符 。 


代码 清单 11-1 具有 文件 作用 域 的 标识 符 





#include <stdio.h> 


// 这 里 0utStruct 结 构 体 类 型 处 于 文件 作用 域 

struct OutStruct 

{ 
// a 是 OutStruct 结 构 体 的 成 员 对 象 ， 不 具有 作用 域 属性 
int a; 











































































































// InnerStruct 是 定义 在 OutStruct 内 部 的 结构 体 ， 但 具有 文件 作用 域 
struct InnerStruct 
























































int 工 
} inner; // 这 里 inner 作 为 0utStruct 结 构 体 的 成 员 对 象 
// 在 OutStruct 结 构 体 内 定义 的 枚 举 类 型 也 具有 文件 作用 域 
enum MY_ENUM 

































































// 这 里 面 的 枚 举 常量 也 同样 具有 文件 作用 域 
MY_ENUM_1， 























MY_ENUM_2 
} e; 


}; 


// 这 里 对 象 sa 处 于 文件 作用 域 ， 

// 另外 我 们 可 以 看 到 定义 在 OutStruct 结 构 体 内 部 的 InnerStruct 可 以 直接 被 访问 ， 
// 也 就 是 说 InnerStruct 是 全 局 可 见 的 ， 因此 它 具 有 文件 作用 域 

static int sa = sizeof(struct InnerStruct ) ， 


// MyTest 函 数 具有 文件 作用 域 


static void MyTest(void) 


{ 

// 尽管 宏 MY_MACRO 定 义 在 MyTest 函 数 内 ， 但 它 仍然 具 有 文件 作用 域 ， 不 受 函 数 语 句 块 的 影响 
#define MY_MACRO 100 

} 


// main 函 数 处 于 文件 作用 域 
int main(void) 
{ 
Struct OutStruct out = { 10, { 100 }, MY_ENUM 2 }; 






































































































































// 这 里 可 直接 访问 InnerStruct 结 构 体 类 型 
Struct InnerStruct inner = { 20 }; 

















// 这 里 也 可 以 直接 访问 宏 MY_MACRO 
printf("The value is: %d\n", out.a + out,.inner.i + inner.i + sa - 
MY_MACRO ) ， 














代码 清单 11-1 中 我 们 可 以 清晰 地 看 到 ， 在 具有 文件 作用 域 的 结构 体 
内 再 定义 一 个 结构 体 ， 其 内 部 结构 体 也 具有 文件 作用 域 。 所以， 为 了 避 
免 全 局 名 字 空 间 的 污染 ， 我 们 在 编写 C 语 言 程 序 时 应 当 尺 量 避免 在 文件 
作用 域 中 定义 的 结构 体 、 联 合体 内 定义 命名 结构 体 或 联合 体 ， 取 而 代 之 
的 是 ， 可 以 用 匿名 结构 体 或 联合 体 。 





此 外 ， 代 码 清 蛙 11-1 中 我 们 还 看 到 了 宏 不 受 其 他 作用 域 的 影响 ， 始 
终 保持 着 文件 作用 域 的 特性 ， 这 也 是 预 处 理 指示 符 的 特性 。 


11.1.2 ”也 数 作用 域 














C 语 言 标准 明确 规定 ， 跳 转 标 签名 是 仅 有 的 具有 函数 作用 域 的 标识 
从。 函数 作用 域 从 一 个 函数 体 的 开始 〈 即 紧 跟 在 { 符 写 的 后 面 )， 一 直 
到 沙 数 体 结束 〈( 即 紧 跟 在 } 符 号 前 面 )。 跳 转 标 签 可 以 出 现在 函数 体 中 
的 任何 位 置 ， 在 使 用 时 ， 随 着 goto 语 句 一 起 出 现 。 


代码 清单 11-2 将 简单 描述 仅 有 的 作为 函数 作用 域 标识 得 的 跳 转 标 签 
名 。 


代码 清单 11-2 具有 函数 作用 域 的 标识 符 〈( 跳 转 标 签 ) 





#include <stdio.h> 
int main(void) 


int count = 5; 
/7 这 里 声明 了 一 个 HELLO_LABEL 跳 转 标签 ， 它 具有 函数 作用 域 
HELLO_LABEL : 
puts("Hello, world!"); 
if(--count > 0) 
goto HELLO_LABEL;  // 跳 转 到 HELLO_LABEL 标 签 处 
switch(count) 
























































case 1: 
count = 0; 
break; 
case 0: 
count = 3,; 














// 这 里 尽管 在 switch 语 句 块 内 声明 SWITCH_INNER_LABEL 跳 转 标 签 
// 但 它 仍 然 属 于 函数 作用 域 
SWITCH_INNER_LABEL : 
printf("count = %dxn"，count ) ， 
break; 
default: 
break; 












































if(--count > 0) 
goto SWITCH_INNER_LABEL ; // 跳 转 到 HELLO_LABEL 标 签 处 





代码 清单 11-2 可 以 清晰 地 看 到 ， 跳 转 标 签 始终 具有 函数 作用 域 ， 而 
不 受 其 他 语句 块 作用 域 的 影响 。 这 也 是 为 什么 C 语 言 标 准将 跳 转 标签 专 
门 独立 出 一 个 函数 作用 域 的 原因 。 





11.1.3 ”函数 原型 作用 域 


C 语 言 标 准 指出 ， 如 果 一 个 标识 符 是 声明 在 一 个 函数 原型 (该 函数 
原型 不 作为 函数 定义 的 一 部 分 中 的 形 参 列表 内 ， 那 么 该 标识 符 则 具有 
函数 原型 作用 域 。 函 数 原型 作用 域 从 形 参 列表 的 “<(” 开 始 ， 到 函数 声明 
和 从 的 末尾 结 





不 过 当前 主流 编译 器 中 ， 普 过 不 满足 函数 原型 作用 域 到 函数 声明 符 
的 末尾 结束 ， 而 一 般 是 将 作用 域 范围 缩短 到 了 形 参 列 表 中 芭 跟 ) 符号 之 

。 所 以 我 们 在 利用 函数 原型 作用 域 中 的 标识 符 的 时 候 需 要 注意 实现 上 
的 差异 性 。 代 码 清单 11-3 展 示 了 函数 原型 作用 域 的 概念 。 











代码 清单 11-3 ”函数 原型 作用 域 


























/** 这 里 ， 形 参 标 识 符 a 以 及 形 参 标识 符 pArray 都 具有 函数 原型 作用 域 。 
* 我 们 可 以 看 到 ， 在 声明 pArray 形 参 的 时 候 还 用 到 了 形 参 a 的 标识 符 ， 
* 说 明 形 参 a 标 识 符 在 此 形 参 列表 中 可 见 。 
* 在 Clang 编 译 器 中 ， a 
* 那么 编译 器 就 会 报错 : 标识 符 'a' 没 

































































*/ 
static int (*Foo(int a, int (*pArray)[sizeof(a)]))[sizeof(int)]; 





这 里 补充 说 明 一 下 ， 代 码 清单 11-3 中 ， 函 数 Foo 被 声明 为 具有 
int (*) [sizeof (int〉] 指 癌 数 组 的 指针 返回 类 型 ， 带 有 int 类 型 的 形 参 a 以 
及 带 有 int(*) [sizeof (a)》] 指 问 数 组 的 指针 类 型 的 形 参 pArray。 


11.1.4 ”语句 块 作用 域 


C 语 言 标准 指出 ， 如 果 一 个 标识 符 的 声明 出 现在 一 个 语句 块 内 ， 或 
是 出 现在 一 个 函数 定义 中 的 形 参 声明 列表 中 ， 那 么 该 标识 符 具有 语句 块 
作用 域 。 语 句 块 作用 域 是 从 当前 语句 块 的 {开始 一 直到 } 结 来 。 


这 里 要 注意 的 是 ， 之 前 也 提 到 过 ， 结 构 体 、 联 合体 、 枚 举 类 型 定 
时 的 花 括 号 不 算 语 句 块 ， 和 它们 均 属 于 闫 型 说 明 符 (type specifier) 的 一 
部 分 。 在 结构 体 与 联合 体 中 ， 花 括号 内 的 数据 对 象 属于 该 结构 体 或 联合 
体 的 成 员 ， 数 据 对 象 成 员 不 具有 “作用 域 ” 这 个 属性 ; 如 果 是 内 髓 定义 命 
名 结构 体 或 联合 体 ， 那 么 内 髓 的 结构 体 或 联合 体 的 作用 域 与 其 外 部 结构 
体 或 联合 体 的 作用 域 一 样 。 枚 举 类 型 中 的 枚 举 常 量 ， 其 作用 域 与 枚 举 类 
型 一 样 。 代 码 清单 11-4 展 示 了 语句 块 作用 域 以 及 上 述 提 到 的 一 些 注意 事 
i 











代码 清单 11-4 语句 块 作用 域 的 描述 





#include <stdio.h> 


// MyStruct 结 构 体 具有 文件 作用 域 
struct MyStruct 






































int a; 


2 下 面 这 个 数组 对 象 声 明 会 引发 错误 ， 由 于 成 员 a 不 作为 任何 作用 
/ 因此 在 声明 结构 体 成 员 对 象 的 时 候 无 法 被 引用 


4 b[sizeof(a)]; 


// InnerStruct 结 构 体 同样 具有 文件 作用 域 
struct InnerStruct 











这 





或 ， 













































































int 1i; 
} inner ， 


了 


// MyEnum 具 有 文件 








// 












































于 InnerStruct 具 有 文件 作用 域 ， 


























// 因此 它 可 以 在 对 象 成 员 声 明 中 被 引用 ， 而 inner 对 象 则 不 行 


int c[sizeof(struct InnerStruct)]; 











enum MyEnum 


// MyEnum1 与 MyEnum2 两 个 枚 举 常量 都 具有 文件 作用 域 
MyEnum1 = 1, 
MyEnum2, 


{ 


*/ 


static int (*Foo(int a, 


int 








// 














作用 域 











































































































// 所 

















这 里 的 函数 Foo 




































































不 过 在 Clang 实 现 中 ，a 








姑 此 ， 


























于 MyEnum1 与 MyEnum2 两 个 枚 举 常 量 都 有 具有 文件 作用 域 ， 
以 它们 可 以 在 声明 后 续 枚 举 常量 中 被 引 } 
MyEnum3 = MyEnum1 + MyEnum2 
































有 文件 作用 域 ， 并 且 由 于 它 是 一 个 函数 定义 ， 


























攻 参 对 象 a 以 及 arr 具 有 语句 块 作 用 域 ， 并 且 第 二 个 形 参 arr 则 





直接 引 














用 


了 标识 符 a。 

















这 里 sizeof(int) 中 的 ijnt 改 为 a 就 会 编译 报错 。 























这 里 Foo 函 数 的 返回 类 




















型 为 : int (*)[sizeof(int)] 














// 





于 形 参 对 象 a 














// 

















// int a = 10; 

















// 





于 在 函数 体内 ， 




















int arr[sizeof(a)]))[sizeof(int)] 


有 语句 块 作用 域 ， 因 此 在 函数 体内 完全 可 以 被 访问 
printf("a = %d\n", a); 




















于 形 参 a 已 经 在 Foo 函 数 的 语句 块 作用 域 ， 因 此 这 里 不 能 














te 














乃 然 不 能 在 ( ) 形 参 列表 外 可 见 ， 但 可 以 在 函数 体内 可 见 。 


于 以 标识 符 a 来 声明 一 个 对 象 























Foo 函 数 已 经 具有 完整 的 函数 原型 ， 









































寻 此 可 以 在 语句 块 作用 域内 被 引用 


printf("size of return type is: %zu\n", sizeof(Foo(O0, NULL)[90])); 


retu 


main 


rn NULL; 


(void) 

















// 这 里 My0bject 结 


struct MyObject 


}; 


int a; 












































吉 构 体 类 型 具有 语句 块 作用 域 


















































// 这 里 Inn 结 构 体 也 同样 具有 语句 块 作 用 域 





struct Inn 


int n; 
} inn; 















































// 枚 举 类 型 TheEnum 具 有 语句 块 作用 域 


enum 


}; 


// 3 
stru 


// 3 





TheEnum 








// 下 面 的 TheEnum1 与 TheEnum2 枚 举 常 量 都 











TheEnum1, 
TheEnum2 













































































| 用 文件 作用 域 的 MyStruct 与 InnerStruct 
ct MyStruct ms = { 10, (struct InnerStruct){ 20 } }; 


| 用 文件 作用 域 的 MyEnum 


enum MyEnum en = MyEnum2; 


有 语句 块 作 























// 引用 语句 块 作用 域 的 My0bject 与 Inn 
Struct MyObject obj = { 30, (struct Inn){ 40 } }; 


// 引用 语句 块 作用 域 的 TheEnum 
enum TheEnum te = TheEnumi1; 


// 调用 文件 作用 域 的 Foo 函 数 


Foo(ms.a + ms.inner.i + en + obj.a + obj.inn.n + te, NULL); 









































} 


void foo(void) 











struct MyObject obj; // 错误 ，My0bject 无 法 被 访问 
enum TheEnum en = TheEnum1; // 错误 ，TheEnum 与 TheEnum1 无 法 被 访问 











// 引用 文件 作用 域 的 MyStruct 与 InnerStruct，0OK 
Struct MyStruct ms = { 10，(Struct InnerStruct){t 20 } }; 





























// 引用 文件 作用 域 的 MyEnum，OK 
enum MyEnum en = MyEnum2， 





代码 清单 11-4 比 较 详细 地 展示 了 语句 块 作用 域 的 特点 以 及 它 与 文件 
作用 域 和 函数 原型 作用 域 的 差异 性 。 





由 于 之 前 提 到 ， 在 一 个 源 代 码 上 下 文中 ， 同 一 标识 符 在 不 同位 置 可 
指 代 多 个 不 同 实体 ， 因 此 在 C 语 言 中 ， 不 同 作用 域 的 相同 标识 符 是 可 被 
重 定义 的 ， 下 面 我 们 将 介绍 C 语 言 中 标识 符 的 重 定义 以 及 作用 域 的 县 


— 
人 


父 。 








11.1.5 ”标识 符 的 重 定义 与 作用 域 的 又 交 





C 语 言 标准 明确 指出 ， 同 一 标识 符 在 程序 中 的 不 同位 置 可 以 指 代 不 
同 实 体 。 此 外 ， 在 同一 名 字 空 间 中 ， 如 果 一 个 标识 符 指 代 了 两 个 不 同 的 
实体 ， 那 么 作用 域 可 能 舍 交 。 如 果 在 同一 名 字 空 间 中 有 相互 合 交 的 作用 
域 ， 那 么 内 部 作用 域 必 须 在 外 部 作用 域 之 前 结束 ， 也 就 是 说 ， 内 部 作用 


域 的 范围 是 外 部 作用 域 的 真子 集 。 如 果 一 个 标识 名 


所 声明 的 实体 将 会 


代码 清单 11-5 介 绍 了 标识 符 的 重 定义 与 作用 域 的 县 


果 。 





代码 清单 11-5 ”标识 符 的 重 定 义 与 作用 域 的 全 





#include <stdio.h> 


#include <stdint.h> 

























































































































































































I 在 外 部 作用 域 和 
内 部 作用 域 声明 了 两 个 不 同 的 实体 ， 那 么 在 内 部 作用 域 中 ， 用 此 标识 符 
履 关 掉 〈 即 隐藏 掉 ) 外 部 作用 域 声 明 的 实体 。 


交 的 作用 与 效 


交 的 作用 与 效果 



































































































































// 在 文件 作 j 域 声明 一 个 整 型 对 象 sa 
static int Sa = 10; 
// 在 文件 作用 域 定义 ] 结构 体 类 型 MyTest 
struct MyTest 
{ 
int a; 
float f; 
}; 
XX 
”在 文件 作 j 域 声明 J 二 个 名 为 Foo 的 函数 ， 
其 中 该 函数 的 形 参 具 有 函数 原型 作用 域 ， 这 里 的 形 参 sa 履 盖 掉 了 文件 作用 域 藤 
罗 多 参 MyTest 玫 车 掉 子 安 件 作用 起 的 Nyfest 络 为 体 类 型 
static void Foo(int16 t sa, double MyTest ) ; 
人 
* 在 文件 作用 域 定义 了 函数 Foo， 其 形 参 列表 中 的 形 参 对 象 具 有 语句 块 作用 域 。 
人 参 具 有 函数 原型 作用 域 ， 这 里 的 参 Sa 巴 益 挤 文件 作用 域 芯 
* 形 参 MyTest 履 盖 掉 了 文件 作用 域 的 MyTest 结 构 体 类 型 





*/ 












































static void Foo(int16 t sa, double MyTest) 
{ 


int 


printf("sa = %d, MyTest = %f\n", sa, MyTest); 


// 这 条 语句 信息 量 很 大 ! 
// 这 里 通过 显 式 加 上 struct 以 指明 所 使 
.f = MyTest 表达 式 中 所 引 
Struct MyTest mt = { 
































// 然后 ， 


printf("The sum result: 














的 MyTest 是 文件 作 











.a = sa, 


%f\n", 





























// 这 里 ， 








Foo 拓 | 





数 语 句 块 作 | 



































// 这 里 调用 文件 作 











Foo(sa, 100.5); 














域 结束 
main(int argc, const char* argv[]) 


] 域 的 Foo 函 数 ， 并 引 | 





的 MyTest 标 识 符 指 代 的 是 形 
‘ff = MyTest }; 























上 
/ 



































] 域 的 结 Ee 8 











mt.a + mt.f); 














了 文件 作用 域 的 sa 整 型 对 象 








Foo : 


// 在 main 函数 体 


int aa = 0; 








的 语句 块 作用 域 声 明了 整 型 对 象 aa 










































































































































































































































































if(sa > 0) 

{ 
// 这 里 站 语 句 块 的 作用 域 覆 盖 了 main 函 数 体 的 语句 块 作 用 域 
// 这 里 在 庄 语句 块 作用 域 中 声明 了 sa 整 型 对 象 ， 将 文件 作用 域 的 Sa 给 履 盖 掉 了 
int Sa = aa; 
// 这 里 在 if 语 句 块 作 明了 整 型 对 象 aa， 将 其 外 部 语句 块 的 aa 对 象 覆盖 掉 。 
// 这 里 要 注意 的 是 ， 在 声明 语句 中 一 旦 出 现 了 像 这 里 的 jnt aa 对 象 标识 符 的 声明 ， 
// 那么 该 对 象 标识 符 立即 生效 。 所 以 = 操作 符 右边 的 aa 也 和 表示 这 里 刚直 明 的 对 象 aa， 
// 而 不 是 外 部 语句 块 作用 ee 所 忆 对 于 以 下 语句 编译 器 会 发 出 警告 : 
// “变量 aa 未 被 初始 化 ， 由 于 用 它 自身 给 自己 初始 化 了 ” 


int aa = aa + sizeof(aa); 


aa = Sa - 











// 这 上 


有 printf 沁 | 


10 
数 中 




















// 所 以 这 里 
printf 
/7 这 有 




















} 
// 这 

















有 printf 沁 | 


("inner 
语句 


aa 十 -10， 
Sum 





sa 为 09， 结果 为 
= %d\n", aa + 











块 作 
数 中 的 实 














// sa 则 是 文件 作 


printf("outer sum = %d 


// 在 for 语 句 中 声明 
此 ， 这 里 的 aa 
略 了 { 了 ， 但 此 for 语 句 块 作 月 
aa = 0; aa < 10; 
printf("loop aa = %d\n", 





// 因 
// 这 
for(int 








Bd 
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] 域 结束 





aa 是 














比 main 函 数 体 语 名 


Sa) 











用 域 中 声明 





巴 外 部 声 











// 这 里 儿 
printf(" 


// 这 里 在 main 函 























部 aa 的 值 


outer aa = %d\n", aa); 


数 语 句 块 作用 域 定义 了 MyTest 结 构 体 类 下 





仍然 为 9 





























sr 


// 将 文件 作 
struct MyTest 


float f; 
int i; 


}; 


域 中 定义 的 MyTest 结 构 体 类 型 





的 对 象 。 这 是 
\n", aa + sa); 





的 对 象 具 有 当前 for 语 句 块 的 作 


有 aa 是 0， 





可 











用 





块 作 


sa 是 10， 








的 实 参 aa 与 sa 都 是 此 if 语 句 块 作用 域 中 声明 的 对 象 ， 
-10 

















域 中 声明 的 对 象 ， 
所 以 结果 是 10。 
































明 的 aa 对 象 给 覆盖 





aa++) 
aa); 





由 给 














// 这 








EE 引用 的 是 main 函 数 语句 块 作 | 














Struct MyTest mt = { -10.5f, 100 }; 


if(aa == 0) 
goto Foo; 


puts("Hello, world!"); 

















// 这 里 在 函数 作 | 


























// 尽 
// 因为 当 


Bs) 



































// 作为 函 

















， 则 作 / 





























// 它们 


可 
上 下 


Foo(mt.i, mt.f); 
puts("Completed!"); 


于 两 种 不 同 的 名 字 空 间 


掉 了 ， 











用 域 为 for 语 句 块 的 作 








域 。 














Nt 贡 下 调和 


全 覆盖 掉 了 


域 中 声明 了 作为 跳 转 标签 的 Foo 


管 存 在 表示 跳 转 标签 的 Foo， 但 这 并 不 妨碍 对 Foo 函 数 的 调用 。 
Foo 出 现在 goto 后 面 
数 调用 表达 式 出 现 


人 全 
函数 标识 符 9 这 一 点 C 语 言 乡 





的 ;符号 后 结束 





= = 


域 中 的 MyTest 结 构 体 




















[区 


译 器 能 做 出 准确 区 分 。 








代码 清单 11-5 展 示 了 比较 完整 的 标识 符 重 定义 以 及 作用 域 登 交 特 
性 。 在 不 同 作用 域 ， 如 果 标识 符 所 指 代 的 类 别 不 一 样 ， 编 译 右 可 以 通过 
表达 式 以 及 语句 的 表达 形式 做 出 区 分 ， 比 如 是 结构 体 类 型 还 是 人 条 个 对 象 
标识 符 ， 还 是 函数 标识 符 或 跳 转 标 签 。 如 果 是 相同 类 别 的 ， 那 么 内 部 作 
用 域 的 对 象 会 把 外 部 作用 域 的 给 宪 盖 掉 。 


11.1.6 标识 和 从 的 名 字 空 间 





本 节 是 对 上 一 市 的 补充 说 明 。C 语 言 标准 明确 指出 ， 如 果 同 一 标识 
符 的 多 个 声明 在 茶 个 翻译 单元 中 的 任 一 点 可 见 ， 那 么 C 语 言 实现 的 语法 
上 下 文 将 通过 不 同 实体 类 别 来 消除 歧义 。 所 以 ， 在 C 语 言 中 对 于 不 同类 


别 的 标识 符 具有 自己 独立 的 名 字 空 间 (namespace) 。 














C 语 言 标准 指定 了 4 类 名 字 空 间 : 








跳 转 标签 名 : 跳 转 标 签 可 以 在 其 声明 与 使 用 过 程 中 在 语法 上 加 以 


区 分 。 


:结构 体 、 联 合体 以 及 枚 举 的 标签 (tag) : 根据 关键 字 struct、union 
以 及 enum 加 以 区 分 。 注 意 ， 这 三 者 属于 同一 名 字 空 间 。 


结构 体 与 联合 体 的 成 员 (member) : 通过 结构 体 或 联合 体 对 象 的 
成 员 访 问 操 作 符 “.” 或 “->” 进 行 区 分 。 


:所 有 其 他 标识 符 ， 也 被 称 为 普通 标识 符 : 以 普通 〈ordinary) 声明 
符 声 明 的 标识 符 ， 或 是 作为 枚 举 常 量 。 


这 里 要 注意 的 是 ， 同 一 类 别 的 名 字 空 间 是 无 法 进行 区 分 的 ， 而 C 语 
言 标准 将 结构 体 、 联 合体 以 及 枚 举 标签 部 放 在 一 类 ， 这 就 说 明了 结构 
体 、 联 合体 以 及 枚 举 的 类 型 标识 符 是 无 法 同时 存在 于 同一 作用 域内 的 。 
代码 清单 11-6 进 一 步 描述 了 在 同一 作用 域内 不 同名 字 空 间 类 别 的 标识 符 
的 使 用 。 





代码 清单 11-6 ”标识 符 的 名 字 空 间 





#include <stdio.h> 


// 在 文件 作 lj 域 声明 一 个 整 型 对 象 sa 
static int sa = 10; 



































// 在 文件 作用 域 定义 J 结构 体 类 型 sa 
// I 攻 结 四 体 标 乱 与 普通 ee 符 属于 不 同 的 名 字 空 间 ， 因 此 这 里 可 以 直接 使 用 


struct sa 

























































































* 在 文件 作用 域 定义 了 一 个 枚 举 类 型 SA。 
LA 于 枚 举 标签 0 名 字 空 
* 因此 这 里 能 使 sa 作为 枚 举 类 型 的 标识 各 和 



































































































































*/ 
enum SA 
// 由 于 枚 举 常量 与 对 象 标识 只 符 同 属于 一 个 名 字 空间 ， 
// 因此 这 里 不 能 用 sa 作为 枚 举 常量 标识 符 
SA1， 
SA2 
}; 
py A 

















* 在 文件 作用 域 中 定义 了 联合 体 类 型 un， 
单 ， 由 于 体 标签 与 结构 体 标签 属于 同一 名 字 空 间 ， 

* 因此 这 里 不 能 使 用 sa 作为 联合 体 类 型 的 标识 符 

*/ 

union un 


// 这 里 可 以 用 sa 作为 该 联合 体 的 成 员 


int sa; 

















二 










































































// 同样 ， 这 里 也 能 用 un 作为 该 联合 体 的 成 员 


float un; 



































* 这 里 在 文件 作用 域 定义 了 函数 SA。 
* 由 于 SA 属于 其 他 标识 符 的 名 字 空 间 ， 因 此 与 枚 举 类 型 不 冲突 。 
* 此 外 ， 形 参 对 象 sa 属 于 语句 块 作用 域 ， 因 此 与 文件 作用 域 的 sa 也 不 冲突 




























































































*/ 
static void SA(int sa) 


// 这 里 引用 的 是 SA 函数 的 语句 块 作用 域 中 的 形 参 对 象 Sa 
printf("sa = %d\n", sa); 















































int main(int argc, const char* argv[]) 


// 这 里 用 文件 作用 域 的 枚 举 类 型 SA 声明 了 对 象 es， 
SA2 枚 举 和 常量 对 其 初始 化 
A es = SA2; 


// 这 里 调用 了 文件 作用 域 的 函数 SA， 
// 并 用 文件 作用 域 对 象 Sa 与 语句 块 作用 的 es 对 象 的 和 作为 实 参 

















































































































// 这 里 用 文件 作用 域 的 sa 结构 体 类 型 声明 了 对 象 S 
Struct SaSs={es，10.5f }; 











































































































// 这 里 用 文件 作用 域 的 联合 体 类 型 un 声明 了 对 象 un，、 
// 用 语句 块 作用 域 的 对 象 的 成 员 f 对 其 un 成 员 进 行 初始 化 
union un un = { .un = s.f }; 





























// 这 里 访问 的 是 声明 在 语句 块 作用 域 的 对 象 un 的 un 成 员 


printf("un is: %f\n", un.un); 
































// 以 下 这 条 语句 错误 ! 因为 以 下 语句 声明 的 es 标识 符 属于 其 他 标识 符 名 字 空 间 
// 而 在 此 语句 块 作用 域内 ， 己 经 声明 了 es 标识 符 作 为 枚 举 类 型 的 对 象 ， 它 也 属于 其 他 标识 符 名 字 空 间 


int es = 0) 


// 在 语句 块 作用 域内 重新 定义 了 枚 举 类 型 SA 
enum SA { SA1, SA2, SA3 }; 


// 这 句 声明 符 没有 问题 。 因 为 这 里 声明 的 SA 作为 数据 对 象 ， 
// 而 前 的 SA 标识 符 用 于 枚 举 类 型 
int SA = 0; 


// 以 下 这 条 语句 错误 ! 因为 SA1 在 此 语句 块 作用 域内 已 经 被 用 作 枚 举 常 量 
// 而 数据 对 象 标识 符 的 名 字 空 间 与 枚 举 常 量 标识 符 同 属于 其 他 标识 符 名 字 空 
// 因此 会 产生 冲突 


int SA1 = SA; 


// 这 人 句 声 明 没 有 问题 ， 在 语句 块 作用 域 声 明了 sa 对 象 ， 并 用 SA 对 象 对 其 初始 化 。 
// 这 里 ，sa 对 象 履 盖 了 文件 作用 域 的 sa 对 象 


int sa = SA; 



























































































































































间 ， 






















































































if(sa == 0) 
goto SA; 


puts("Dummy output!"); 


// 这 里 SA 用 作为 跳 转 语句 标签 ， 因 此 与 上 面 同一 语句 块 作用 域 中 的 用 作 枚 举 类 型 ， 

// 以 及 用 作 整 型 对 象 的 标识 符 不 冲突 。 

// 而 C 语 言 更 是 将 跳 转 标 签 专 门 独立 出 即 函 数 作用 域 
SA: 

SA = sa + 1; 

printf("SA = %d\n", SA); 
















































































代码 清单 11-6 介 绍 了 在 同一 作用 域内 ， 同 一 标识 符 能 同时 指 代 不 同 
实体 的 效果 。 当 然 ， 为 了 不 引起 混 消 ， 各 位 在 实际 项 目 中 应 当 尽 量 避 免 
标识 符 重 登 的 情况 ， 尤 其 像 函 数 内 的 局 部 标识 符 履 兰 了 文件 作用 域 的 全 
局 标识 符 ， 有 很 多 难以 发 现 的 Bug 都 是 这 种 标识 符 重 登 所 产生 的 。 因 
此 ， 这 里 对 作用 域 与 名 字 空 间 详 细 的 介绍 不 是 为 了 蓝 励 程序 员 有 针对 性 
地 加 以 利用 ， 更 多 的 是 告诉 C 语 言 编译 器 的 实现 者 ， 让 这 些 开 发 者 知道 
C 语 言 标准 对 作用 域 以 及 名 字 空 间 的 实现 情况 ， 使 得 自己 开发 的 C 语 言 
编译 器 能 遵循 C 语 言 标 准 。 
































讲 完了 C 语 言 程 序 的 作用 域 与 名 字 空 间 。 下 面 三 节 将 介绍 C 语 言 中 
对 象 与 函数 的 连接 〈linkage) 。C 语 言 标准 中 ， 一 个 对 象 或 函数 标识 符 
可 以 在 不 同 作用 域 或 同一 作用 域内 进行 多 次 声明 ， 而 这 些 重复 的 声明 可 
以 通过 称 为 连接 的 过 程 来 引用 同一 对 象 或 函数 。C 语 言 中 一 共有 三 种 连 
接 类 型 : 外 部 连接 (external linkage) 、 内 部 连接 (internal linkage) 与 
无 连接 Cnone) 。 下 面 我 们 将 分 别 介绍 这 些 相关 内 容 。 





11.2 ”全 局 对 象 与 函数 


用 extern 存 储 类 说 明 符 〈storage-class specifier) 声明 的 对 象 与 函数 
有 其 有 外 部 连接 。 对 于 一 个 数据 对 象 ， 如 果 只 有 仿 extern 的 声明 ， 那 么 它 
还 不 具有 一 个 实体 ， 只 有 当 它 在 文件 作用 域 中 用 不 带 extern 的 声明 之 后 
才 具 有 实体 ， 并 且 作 为 一 个 全 局 对 象 。 对 于 一 个 函数 ， 如 果 用 extern 或 
缺 省 存储 类 说 明 符 对 函数 声明 ， 那 么 该 函数 具有 外 部 连接 。 如 果 只 声明 
了 一 个 函数 原型 ， 那 么 该 函数 也 没有 实体 ， 只 有 对 该 函数 定义 之 后 才 有 
实体 。 在 定义 函数 时 ， 如 果 用 extern 或 缺 省 存储 类 说 明 符 进行 定义 ， 那 

函数 具有 外 部 连接 ， 并 且 称 该 函数 为 全 局 函数 。 














另外 ，C11 标 准 也 明确 指出 ， 在 C 语 言 未 来 版 本 中 ， 存 储 类 说 明 符 
应 该 只 能 放 在 整个 对 象 与 钞 数 声 明 的 最 前 面 ， 而 不 能 放 在 其 他 位 置 。 








全 局 对 象 与 函数 的 声明 在 同一 翻译 单元 中 可 出 现 多 次 ， 即 便 是 在 同 
一 作用 域 中 。 然 而 ， 对 对 象 的 定义 只 能 有 一 次 。 如 果 在 声明 一 个 全 局 对 
象 的 同时 ， 又 对 它 进 行 初 始 化 ， 那 么 此 时 这 声明 吏 对 该 对 象 进行 了 定 
义 ， 同 时 该 对 象 也 具有 了 实体 。 对 全 局 对 象 与 函数 的 定义 只 能 有 一 次 ， 
人 否则 在 连接 时 ， 连 接 占 会 报 重 定义 外 部 符号 的 连接 错误 。 











代码 清单 11-7 展 示 了 全 局 对 象 与 函数 的 声明 与 定义 。 


代码 清单 11-7 全 局 对 象 与 函数 的 声明 与 定义 

















/** 以 下 是 test.c 源 文件 里 的 内 容 */ 
// 声明 了 具有 外 部 连接 的 全 局 对 象 ga 
extern int ga; 


// 这 里 再 次 声明 具有 外 部 连接 的 全 局 对 象 ga， 
// 然而 此 时 ga 对 象 仍然 不 具备 实体 。 
// 另外 ， 由 于 ga 的 实体 是 在 main . c 翻 译 单元 中 产生 的 ， 因 此 这 里 对 ga 的 声明 必须 加 extern， 
// 否则 会 引发 连接 时 的 符号 重 定义 错误 

extern int ga; 


// 声明 了 具有 外 部 连接 的 全 局 函数 test 
extern void test(void); 




















































































































































































































// 再 次 声明 具有 外 部 连接 的 全 局 函数 test， 
// 这 里 缺 省 了 存储 类 说 明 符 extern， 但 默认 为 extern 
void test(void); 



































// 这 里 对 test 进 行 定义 。 , 
// 在 函数 定义 时 ， 通 常 extern 缺 省 ， 也 表示 当前 函数 为 具有 外 部 连接 的 全 局 函数 


void test(void) 


















































ga = 100; 





} 
/xx 以 下 是 main.c 源 文件 中 的 内 容 */ 
#include <stdio.h> 


// 声明 了 全 局 对 象 ga， 并 且 此 时 ga 具有 了 实体 





















































int ga; 

// 再 次 声明 了 全 局 对 象 ga 

int ga; 

// 这 里 声明 了 全 局 函数 test， 使 得 test 标 识 符 在 当前 翻译 单元 中 可 见 。 



































// 由 于 在 test ,c 中 已 经 对 函数 test 做 了 定义 ， 所 以 在 main.c 中 就 不 能 再 次 对 它 定 义 ， 
// 和 否则 在 连接 时 会 报 test 符 号 重 定义 的 错误 
extern void test(void); 


// 声明 了 具有 外 部 连接 的 全 局 对 象 ma， 此 时 ma 已 具备 实体 


Int ma; 


// 再 次 声明 了 全 局 对 象 ma， 并 且 同 时 对 它 进 行 初 始 化 。 此 时 ， 这 个 声明 就 是 对 ma 的 定义 
int ma = 10; 


// 这 里 仍然 可 以 对 ma 做 声明 
























































































































































// 这 里 错误 ! 由 于 之 前 对 全 局 对 象 ma 做 过 初始 化 ， 
// 因此 这 里 再 进行 初始 化 会 引发 外 部 符号 重 定义 的 连接 错误 


int ma = 20; 












































= 




















int main(int argc, const char* argv[]) 


// 全 局 函数 与 对 象 的 声明 也 可 放 在 语句 块 作用 域 ， 
// 使 得 当前 作用 域 对 此 标识 符 可 见 


void test(void); 


// 在 语句 块 作用 域 中 对 部 连接 的 对 象 进行 声 明 时 ， 
// 0 否则 声明 的 标识 符 将 不 具有 连接 ， 
// 而 是 作为 该 语句 块 作用 域 中 的 局 部 对 象 ， 而 覆盖 掉 文 件 作用 域 的 全 局 对 象 


extern int ma; 












































































































































// 调用 全 局 函数 test 
test(); 

















// 在 当前 的 main.c 翻 译 单元 以 及 test .c 翻 译 单元 中 
// cp sh 个 实体 ; 而 全 局 函数 test 也 是 同一 个 函数 实体 
printf("result is %d\n", ga + ma); 























代码 清单 11-7 中 含有 两 个 源 文件 test.c 与 main.c 的 代码 ， 这 样 可 以 将 
这 两 个 源 文件 分 别 作 为 两 个 不 同 的 翻译 单元 ， 从 而 体现 出 具有 外 部 连接 
的 全 局 对 象 与 函数 标识 符 都 引用 的 是 同一 个 实体 。 各 位 在 上 机 实践 时 ， 
也 是 分 别 用 两 个 源 文 件 来 输入 这 些 代 码 ， 并 且 将 这 两 个 源 文件 放 在 同一 
项 目 工程 目录 下 的 。 代 码 清 单 11-7 展 示 了 具有 外 部 连接 的 全 局 对 象 与 函 
数 的 特性 以 及 在 使 用 时 需要 注意 的 地 方 。 这 里 要 注意 的 是 ， 在 一 个 源 文 
件 中 对 具有 外 部 连接 的 对 象 或 函数 做 了 定义 ， 使 得 它 有 了 实体 之 后 ， 那 
么 在 其 他 源 文件 中 就 不 能 再 次 对 它 进行 定义 ， 否 则 会 引发 连接 时 的 符号 
重 定义 错误 。 在 其 他 源 文 件 中 ， 为 了 能 使 得 当前 翻译 单元 识别 到 此 符号 
的 存在 ， 只 能 对 具有 外 部 连接 的 全 局 对 象 或 函数 进行 声明 。 另 外 ， 还 需 
要 注意 的 是 ， 对 不 产生 实体 的 全 局 对 象 做 外 部 声明 时 需要 加 上 extern 存 
储 类 说 明 符 ， 否 则 也 会 引发 连接 时 的 符号 重 定义 错误 。 


























11.3 ”静态 对 象 与 函数 


用 存储 类 说 明 符 static 修 饰 的 对 象 与 函数 称 为 静态 对 象 与 函数 。C 语 
言 标准 明确 指出 : 如 果 一 个 对 象 或 函数 的 声明 在 一 个 文件 作用 域 中 ， 并 
且 包 含 static 存 储 类 说 明 符 ， 那 么 该 对 象 或 函数 具有 内 部 连接 。 然 而 ， 与 
全 局 对 象 不 同 ， 静 态 对 象 除了 可 以 定义 在 文件 作用 域 之 外 ， 还 可 以 定义 
在 语句 块 作用 域 中 ， 而 定义 在 语句 块 中 的 静态 对 象 没有 连接 。 与 全 局 对 
象 与 函数 类 似 的 是 ， 静 态 对 象 与 函数 的 声明 也 可 以 在 同一 文件 作用 域 中 
出 现 多 次 ， 但 是 在 同一 文件 作用 域 中 对 静态 对 象 的 初始 化 只 能 出 现 一 
次 ; 同样 ， 对 静态 函数 的 定义 也 只 能 出 现 一 次 。 对 C 语 言 中 的 函数 而 
， 无 论 是 具有 外 部 连接 的 全 局 函数 还 是 具有 内 部 连接 的 静态 函数 ， 都 
只 能 在 文件 作用 域内 进行 定义 ， 同 时 也 只 有 具有 外 部 连接 的 全 局 函数 才 
可 以 在 语句 块 作用 域 中 声明 ， 而 具有 内 部 连接 的 静态 函数 则 不 允许 在 语 
句 块 作用 域内 声明 。 同 时 ， 如 果 一 个 静态 对 象 声 明 在 语句 块 作用 域 中 ， 
那么 不 能 对 它 进行 重复 声明 。 因 为 在 语句 块 作用 域 中 ， 对 一 个 静态 对 象 
的 声明 就 已 经 相当 于 对 它 的 定义 ， 它 已 经 被 实例 化 了 ， 无 论 它 有 没有 同 
时 被 初始 化 。 
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为 外 ， 与 外 部 连接 不 同 的 是 ， 具 有 内 部 连接 的 鹏 态 对 象 与 函数 并 不 
古 在 整个 程序 或 库 中 指 代 同 一 个 实体 ， 而 是 在 其 各 自 的 翻译 单元 中 指 代 
同一 对 象 或 函数 。 而 一 个 翻译 单元 也 惑 是 我 们 通常 所 谓 的 一 个 C 源 文 


件 。 因 此 ， 如 果 我 们 在 两 个 C 源 文件 ， 比 如 a.c 和 b.c 中 ， 都 在 文件 作用 域 
定义 了 一 个 静态 对 象 ， 比 如 一 “static int staticObject; ”， 那么 当 编 译 

之 后 ，a.c 编 译 之 后 所 产生 的 目标 文件 a.0 与 b.c 编 译 后 所 产生 的 目标 文件 
b.o 中 各 自 都 含有 一 个 名 为 staticObject 的 、 具 有 内 部 连接 的 整 型 对 象 实 

体 ， 因 此 当 连 接 器 在 连接 之 后 ， 这 两 个 对 象 将 是 同时 存在 的 ， 而 它们 在 
各 目的 翻译 单元 中 分 别 表示 当前 所 处 翻译 单元 中 的 状态 。 











静态 对 象 的 情况 比较 复杂 ， 我 们 通过 代码 清单 11-8 这 一 详细 的 示例 
代码 做 细节 上 的 进一步 讲解 。 


代码 清单 11-8 ”静态 对 象 与 函数 














/xx 以 下 是 test,c 源 文件 里 的 内 容 */ 
#include <stdio.h> 





























eh a i -10 进 行 初始 化 
static int sa = 














static void SFoo(void) 
Sa++， 


printf("sa in %s = %d\n", _ FILE , sa); 



























































// 这 里 定义 了 具有 外 部 连接 的 全 局 函数 test， 用 于 间接 调用 具有 静态 连接 的 SFoo 函 数 以 观察 结果 


void test (void) 





























SFoo(); 


/** 以 下 是 main.c 源 文 件 中 的 内 容 */ 
#include <stdio.h> 


// 在 文件 作用 域 声 明 静 态 对 象 saa，sa 具 有 内 部 连接 


static int sa; 


// 这 里 次 声明 静态 对 象 sa， 并 对 它 进行 初始 化 
static int sa = 100; 


// 这 里 对 静态 对 象 sa 进 行 再 次 声明 ， 但 不 能 再 进行 初始 化 
static int sa; 


// SFo0 函 数 在 文件 作用 域内 被 定义 为 静态 函数 ， 从 而 具有 内 部 连接 


static void SFoo(void) 







































































































































































int 


代码 清单 11-8 也 同样 创建 了 两 个 C 源 文件 ， 
名 为 main.c。 我 们 看 到 ， 
两 个 不 同 的 实体 ， 两 者 都 分 别 作 用 在 自己 的 翻译 
test.c 中 的 SFoo 静 态 函 




































































































































































































































































































































































































































































// 在 语句 块 作 用 域 中 声明 静态 对 象 ， 则 立即 对 忆 进 行 工 实例 化 的 定义 。 

// 声明 在 语句 块 作用 域 的 静态 对 象 尽 管 没有 连接 ， 但 它 的 行为 就 类 似 于 文件 作用 域 的 静态 对 象 。 
// 当 第 一 次 调用 SFoo 函 数 ， 这 里 inner 静态 对 象 即 被 初始 化 。 

// 而 当 第 二 次 调用 SFoo 函 数 时 ， inner 静 态 对 象 不 会 被 再 次 初始 化 ， 但 还 保留 着 之 前 的 值 
static int inner = 100; 

// 下 面 再 用 static 对 ijnner 对 象 进行 声明 ， 编 译 器 会 报 inner 重 定义 的 错误 

// static int inner; 

// 在 每 次 调用 SFoo 函 数 时 ， 都 对 inner 静 态 对 象 做 一 次 自 增 操作 

Inner++， 

printf("inner = %d, sa = %d\n", inner, sa); 

main(int argc, const char* argv[]) 

// 以 下 声明 错误 ! 在 语句 块 作用 域 中 不 允许 声明 静态 函数 

static void SFoo(void ) 

// 第 一 次 调用 SFoo 函 数 时 ，inner 静 态 对 象 被 初始 化 ， 随 后 做 了 一 次 自 增 操作 

// 所 以 这 里 将 输出 :inner = 101 

SFoo(); 

// 当 第 二 次 调用 SFoo 函 数 时 ，inner 静 态 对 象 没有 再 次 初始 化 ， 

// 但 保留 了 上 次 的 结果 101， 并 且 随 后 也 做 了 一 次 自 增 操作 ， 所 以 这 里 输出 : inner = 102 
SFoo(); 

// 这 里 声明 test 全 局 函数 

extern void test(void); 

// 通过 两 次 调用 定义 在 test .c 中 的 全 局 函数 test， 

// 以 观察 在 test.c 中 定义 的 sa 静态 对 象 以 及 SFoo 静 态 函 数 的 状态 

test(); 

test(); 

// 这 里 声明 静态 sa 将 把 文件 作用 域 的 静态 对 象 Sa 给 覆盖 掉 ， 

// 同时 这 里 的 sa 将 不 具有 连接 

static int Sa = 0; 


printf("inner sa = %d\n", sa); 


// 我 们 



































通过 再 次 调用 


SFoo(); 


SFoo 函 数 可 以 观察 到 文件 作 / 




















域 中 定义 的 sa 对 象 的 当 





口 和 4 二 


前 值 





一 个 名 为 testc， 另 一 人 
test.c 中 的 sa 静态 对 象 与 main.c 中 的 sa 静态 对 象 是 
单元 上 下 文中 。 同 样 ， 
数 与 mnain.c 中 定义 的 SFoo 静 态 函 
函数 实体 ， 里 面 的 实现 也 完全 不 一 样 ， 但 标 计 


数 也 是 两 个 不 同 的 


只 符 完全 一 样 ， 它 们 具有 内 








部 连接 。 因 此 连接 器 在 做 符号 连接 时 ， 在 当前 目标 文件 中 具有 内 部 连接 
的 符号 就 作为 当前 上 下 文 的 一 个 实体 ， 而 对 于 具有 外 部 连接 的 符号 ， 则 
需要 全 局 考虑 。 分 布 在 各 个 目标 文件 中 的 同一 个 具有 外 部 连接 的 符号 ， 
最 终 都 将 指 代为 同一 个 实体 。 所 以 ， 从 这 点 上 来 看 ， 具 有 外 部 连接 的 对 
象 与 函数 是 名 副 其 实 的 全 局 对 象 与 图 数 。 





11.4 局 部 对 象 


声明 为 一 个 函数 形 参 、 或 者 在 一 个 语句 块 作用 域内 没有 用 extern 或 
Ce ee se ee 
声明 在 语句 块 作用 域 中 的 静态 对 象 不 具有 连接 ， 在 此 对 于 不 具有 连 
局 部 对 象 也 不 具有 连接 。 因 此 ， 对 
于 对 象 的 连接 分 类 现在 就 很 明确 了 一 一 在 文件 作用 域 用 extem 存 储 类 说 
明 符 或 不 用 任何 存储 类 说 明 符 声明 的 对 象 ， 以 及 在 语句 块 中 用 extern 存 
储 类 说 明 符 声 明 的 对 象 具 有 外 部 连接 ; 在 文件 作用 域 中 用 static 存 储 类 说 
明 符 声明 的 对 象 具 有 内 部 连接 : 其 余 的 都 没有 连接 。 当 然 ， 之 前 也 提 到 
函数 只 能 被 定义 在 文件 作用 域 ， 而 只 有 具有 外 部 连接 的 函数 才 可 以 
声明 在 语句 块 作用 域内 。 同 时 ， 函 数 必须 具有 连接 ， 不 是 外 部 连接 就 是 
内 部 连接 。 




















各 位 对 局 部 对 象 应 该 已 经 是 相当 熟悉 了 。 像 作为 函数 的 形 参 的 对 
象 ， 以 及 在 语句 块 作用 域 中 声明 的 不 带 任 何 存 储 类 说 明 符 的 对 象 都 属于 
没有 连接 的 局 部 对 象 。 局 部 对 象 只 对 它 所 在 的 作用 域内 可 见 ， 并 且 出 了 
它 所 在 的 作用 域 ， 那 么 它 的 生命 周期 也 就 结束 了 。 


这 里 ，C 语 言 中 还 有 一 个 auto 存 储 类 说 明 符 以 及 register 存 储 类 说 明 
符 来 声明 一 个 局 部 对 象 。 在 早期 C 语 言 中 (尤其 还 没有 被 标准 化 时 )， 








auto 关 键 字 用 于 显 式 声明 一 个 对 象 是 局 部 变量 ， 它 不 具有 连接 ， 其 生命 
周期 也 是 由 函数 实现 自动 回收 的 。 我 们 之 前 提 到 过 ， 函 数 中 定义 的 局 部 
对 象 往往 是 存放 在 栈 空 间 的 ， 当 函数 返回 前 ， 该 函数 所 用 的 栈 会 被 推 
出 ， 使 得 该 函数 之 前 所 持 有 的 局 部 对 象 全 都 被 自动 销毁 ， 所 以 局 部 对 象 
在 那 时 也 被 称 为 自动 的 。 而 现代 C 语 言 〈《 在 C90 标 准确 立 后 ) ，auto 关 键 
字 就 被 逐步 废弃 了 。 而 register 存 储 类 说 明 符 则 是 暗示 C 语 言 编 译 器 ， 当 
前 声明 的 对 象 最 好 被 存放 在 寄存 器 中 ， 由 于 它 可 能 被 重复 使 用 而 应 该 得 
到 最 快速 的 访问 。 然 而 ， 现 代 C 语 言 编译 器 做 得 越 来 越 智 能 ， 尤 其 是 自 
动 内 联 函 数 、 循 环 展 开 优 化 等 技术 成 熟 之 后 ， 优 化 策略 也 丰富 得 多 ， 
此 当前 编译 器 能 自己 更 好 地 合理 分 配 寄存 器 ， 我 们 使 用 register 关 键 字 往 
主 会 阻碍 编译 器 的 进一步 优化 ， 所 以 从 C 语 言 下 一 个 版 本 的 标准 起 ， 标 
; 准 委 员 会 可 能 会 逐步 弃 用 register 关 键 字 或 者 为 它 赋 予 一 种 新 的 语义 ， 因 
此 大 家 在 当前 的 C 语 言 代 码 中 尽量 避免 这 两 个 关键 字 ， 除 非 有 些 编译 器 
对 它们 做 了 语义 上 的 扩展 《比如 ，auto 在 C++ 中 已 经 被 用 作 可 自动 推导 
的 类 型 ) 。 














代码 清单 11-9 简 单 地 给 大 家 介绍 了 声明 局 部 对 象 时 的 auto 与 register 
存储 类 说 明 符 的 使 用 方式 。 


代码 清单 11-9 ”局 部 对 象 以 及 auto 与 register 存 储 类 说 明 符 





#include <stdio.h> 














/** 
六 训 






































这 里 在 文件 作用 域 定义 了 有 共有 内 部 连接 的 静态 函数 foo， 
* 其 雪 对 象 a 和 b 都 是 无 连接 的 局 部 对 象 。 

































































* 其 中 ， 形 参 b 用 register 存 储 类 说 明 符 修饰 ， 
* 暗示 编译 器 将 此 形 参 对 象 尽 量 存放 在 寄存 器 中 
WA4 

static void foo(int a, register int b) 
























































printf("sum = %d\n", a + b); 


int main(int argc, const char* argv[]) 


foo(100, 200); 

















// 这 里 声明 了 一 个 自动 局 部 对 象 a， 
// 其 语义 与 nt a 没有 差别 。 此 外 ，auto 存 储 类 说 明 符 不 能 用 于 声明 一 个 函数 形 参 对 象 


auto int a = 10; 


// 这 里 用 register 存 储 类 说 明 符 声明 了 对 象 r， 暗 示 编 译 器 将 对 象 r[ 尽 量 存 放 在 寄存 器 中 


register int r = 20; 


// 以 下 语句 会 引发 编译 错误 ! 由 于 寄存 器 类 型 的 对 象 在 概念 上 “没有 存储 器 地 址 ”， 
// 因此 ， 不 能 对 register 修 饰 的 对 象 做 取 地 址 操作 
int *p = &r; 































































































printf("value Is: %d\n", a + r); 








代码 清单 11-9 中 也 谈 到 了 使 用 register 存 储 类 说 明 符 声明 的 对 象 在 使 
用 时 的 限制 ， 既 然 一 个 对 象 是 暗示 用 于 存放 在 寄存 器 中 的 ， 那 么 它 就 不 
具有 存储 露地 址 所 以 我 们 不 能 将 它 作为 地 址 操作 符 的 操作 数 。 此 外 ， 
auto 存 储 类 说 明 符 不 能 用 于 修饰 一 个 形 参 对 象 。 








11.5 对 象 的 存储 与 生命 周期 





本 节 将 描述 对 象 的 存储 与 生命 周期 。 在 C 语 言 中 ， 对 象 如 果 从 存储 
区 域 进行 划分 的 话 ， 可 分 为 全 局 数据 存储 区 、 栈 存储 区 以 及 被 动态 分 配 
的 堆 存 储 区 。 而 全 局 数据 存储 区 又 可 分 为 可 读 写 存储 区 以 及 只 该 存储 
只 读 存 储 区 也 称 为 常量 存储 区 。 








之 前 在 第 1 章 中 ， 我 们 提 到 了 和 若干 C 语 言 源 文 件 从 编译 到 连接 ， 最 终 
生成 可 执行 文件 的 流程 。 可 执行 文件 中 就 包含 了 对 函数 〈 指 令 码 ) 、 全 
局 数据 分 布 的 描述 。 当 我 们 点 击 可 执行 文件 ， 或 是 在 控制 台中 输入 可 执 
行文 件 名 然后 按 回 车 键 之 后 ， 操 作 系 统 自 带 的 特定 加 载 器 就 根据 可 执行 
文件 中 所 描述 的 函数 以 及 全 局 对 象 的 布局 分 配 相应 的 存储 空间 。 函 数 代 

一 般 会 被 加 载 到 指定 的 指令 存储 区 ; 一 些 全 局 常量 (比如 字符 串 字 面 
量 ) 根据 实现 ， 可 能 会 被 存放 到 常量 存储 区 ;可 被 修改 的 全 局 数据 对 象 
则 会 被 分 配 到 可 读 写 的 存储 区 。 在 大 部 分 实现 中 ， 仅 有 一 个 声明 而 未 被 
初始 化 的 全 局 对 象 会 以 零 进行 初始 化 ， 但 这 个 行为 并 不 是 C 语 言 标准 明 
确 指 出 的 ， 而 是 当前 大 部 分 环境 都 是 这 么 实现 的 。 也 就 是 说 在 我 们 的 程 
序 正 式 执行 之 前 ， 加 载 器 已 经 给 代码 以 及 全 局 数据 分 配 好 了 存储 空间 ， 
并 且 对 全 局 对 象 完成 了 初始 化 ， 最 后 加 载 器 会 自动 调用 main 函 数 使 程序 
正式 开始 执行 。 因 此 ， 全 局 对 象 的 生命 周期 与 当前 程序 的 一 样 长 ， 直 到 
当前 运行 的 程序 被 关闭 前 ， 全 局 对 象 一 直 可 用 。 这 里 所 描述 的 全 局 对 象 




















包括 具有 外 部 连接 的 全 局 对 象 ， 以 及 具有 内 部 连接 的 静态 对 象 。 


和 一 个 函数 内 定义 的 局 部 对 象 以 及 函数 形 参 对 象 ， 它 们 一 般 会 被 存 
放 在 栈 存储 空间 。 它 们 的 生命 周期 从 声明 开始 ， 一 直到 函数 调用 结束 ， 
最 后 的 栈 指针 复位 即 把 函数 中 所 有 定义 的 局 部 对 象 全 都 销毁 。 妇 外 ， 这 
里 还 有 一 扣 需 要 提出 的 是 ， 对 于 函数 中 的 一 个 左 套 语句 块 作用 域 的 局 部 
对 象 ， 其 生命 周期 是 从 其 声明 开始 ， 一 直到 该 语句 块 结束 ， 而 不 是 函数 
调用 结束 。 这 个 是 从 编程 语言 的 逻辑 上 来 讲 的 ， 即 便 茶 个 C 语 言 实现 可 
使 得 语句 块 作用 域 的 对 象 与 沙 数 的 生命 周期 一 样 长 ， 但 我 们 不 能 做 这 种 
断言 。 


之 前 已 经 提 到 过 ， 由 于 函数 的 栈 空间 十 分 有 限 ， 如 末 我 们 要 分 配 一 
段 较 大 的 存储 空间 ， 我 们 就 需要 调用 malloc 等 C 语 言 标准 库 函 数 来 做 存 
储 空间 的 动态 分 配 。 动 态 分 配 的 存储 空间 由 于 传统 上 使 用 堆 数 据 结 构 进 
行 管理 ， 因 此 我 们 也 把 动态 分 配 的 存储 衬 间 称 为 堆 空间 (heap 
memory) 。 堆 空间 的 生命 周期 从 malloc 成 功 执 行 后 ， 一 直到 调用 free 之 
类 的 库 函 数 进 行 释放 掉 。 这 里 大 家 要 注意 的 是 ， 如 果 一 个 指针 对 象 指 疝 
了 一 个 动态 分 配 的 存储 空间 ， 那 么 后 续 如 果 还 要 用 这 个 指针 去 指向 某 个 
动态 分 配 的 存储 空间 ， 则 必须 先 把 之 前 动态 分 配 的 存储 空间 给 释放 掉 ， 
否则 会 引发 内 存 泄漏 《memory leak) 。 如 果 在 一 个 程序 中 ， 在 某 个 函 
数 中 不 断 动 态 分 配 存 储 空间 ， 却 一 直 不 释放 ， 那 么 该 程序 所 占用 的 内 存 
会 不 断 提 升 ， 最 终 可 能 导致 整个 系统 运行 缓慢 ， 或 是 当前 程序 无 法 再 申 











请 到 更 多 的 存储 空间 而 导致 裔 溃 。 用 malloc 库 函数 动态 分 配 出 来 的 存储 
空间 不 受 栈 的 影响 ， 所 以 即便 退出 当前 函数 ， 该 存储 空间 仍然 有 效 ， 直 
到 对 它 调 用 free 进 行 释放 为 止 。 

代码 清单 11-10 展 示 了 全 局 对 象 、 局 部 对 象 以 及 动态 分 配 存 储 空间 
的 生命 周期 。 


代码 清单 11-10 对象 的 存储 与 生命 周期 





#include <stdio.h> 
#include <stdlib.h> 




































































// 声明 全 局 对 象 ga， 具 有 整个 程序 的 生命 周期 
int ga; 
// 声明 静态 对 象 Sa， 具 有 整个 程序 的 生命 周期 














static Int sa; 


// 函数 foo 的 形 参 对 象 a 的 生命 周期 到 函数 foo 调 用 完成 之 前 


static int* foo(int a) 


{ 





























































































































































































































































































































































































































// 语句 块 作用 域 的 静态 对 象 jnner 也 拥有 整个 程序 的 生命 周期 
static int inner = 1; 
int *p = NULL; 
if(inner > 0) 
{ 
int tmp = inner + a; 
p = &tmp; 
} 
// 这 里 用 指针 p 去 引用 if 语 句 块 中 的 局 部 对 象 tmp。 
// 由 于 tmp 的 生命 周期 在 逻辑 上 已经 在 if 语 句 块 结束 后 就 结束 了 ， 
// 所 以 这 里 我 们 不 应 该 在 实际 项 目 中 做 这 样 的 引 | ， 尽 管 在 macOS 环 境 下 角 E 输 出 正确 结果 
if(p != NULL) 
printf("tmp = %d\n", *p); 
// 这 里 不 能 返回 对 象 a 的 地 址 ， 也 不 能 返回 对 象 p 的 地 址 以 及 指针 p 的 值 ， 
yy 因为 对 象 a 与 p 都 是 函数 foo 的 局 部 对 象 ， 其 生命 W 周 期 在 foo 调 用 结束 后 就 全 都 结束 了 。 
// 而 静态 对 象 inner 的 生命 5 周期 为 整个 程序 的 生命 周 期 ， 因 此 可 以 将 它 地 址 返回 出 来 ， 
// 然后 在 E 他 函数 中 进行 使 上 
return &inner ， 
} 


static int* test(void) 


/ 动态 分 配 了 100 个 ijnt 对 象 存储 空间 
int *p = malloc(100 * sizeof(*p)); 


for(int i = 0; i < 100; I++) 

p[i] = i; 
// ee 间 会 被 一 直 保 留 ， 直 到 它 被 释放 为 止 。 
// 因此 ， 这 里 返 可 动态 分 配合 储 空 间 的 首 地 直 不 会 有 任何 侣 上 


return p; 















































int main(int argc, const char* argv[]) 


// 在 mac0S 运 行 环境 下 ，ga 与 sa 都 被 加 载 器 初始 化 为 9 


printf("ga + sa = %d\n", ga + Sal) 





int *p = foo(100); 


// 这 里 通过 指针 对 象 p 间 接地 修改 了 foo 函 数 中 静态 对 象 jnner 的 值 。 
// 此 时 ，inner 的 值 变 为 了 101 
*p += 100; 









































foo( -100); 


// 调用 test 函 数 之 后 ， 将 动态 分 配 的 首 地 址 传 给 main 中 声明 的 指针 对 象 p 
p = test(); 




















printf("p[9] = %d，p[99] = %d\n", pL9], pL99]); 


// 释放 p 所 指向 的 动态 分 配 的 存储 空间 ， 
// 在 test 函 数 中 动态 分 配 的 存储 空间 生命 周期 结束 
free(p) 
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代码 清单 11-10 分 别 展示 了 全 局 对 象 、 静 态 对 象 以 及 局 部 对 象 的 生 
命 周 期 。 我 们 尤其 要 注意 的 是 ， 如 果 一 个 函数 返回 的 是 指针 对 象 类 型 ， 
那么 返回 的 指针 对 象 应 该 指 同一 个 全 局 对 象 、 静 态 对 象 或 是 动态 分 配 存 
储 空间 的 首 地 址 。 另 外 在 一 般 系 统 中 ， 字 符 串 字面 量 属 于 全 局 帝 量 ， 其 
任 一 元 素 的 地 址 都 可 作为 函数 的 返回 值 。 














11.6 _Thread_ _ local 对 象 


_Thread local 关键 字 首次 在 C11 标 准 中 出 现 ， 它 也 是 一 个 存储 类 说 
明 符 ， 用 它 声明 的 一 个 对 象 表示 该 对 象 在 任 一 线程 中 是 私有 的 。 
_Thread local 可 以 与 extern 或 static 一 同 声明 ， 但 是 一 个 _Thread local 对 象 
必须 要 么 具有 外 部 连接 ， 要 么 具有 内 部 连接 。_Thread local 对象 的 生命 
周期 为 “线程 存储 周期 ”(thread storage duration) ， 其 整个 生命 周期 从 线 
程 启动 执行 一 直到 线程 退出 。 当 线程 启动 执行 之 前 ，_Thread local 对 象 
会 为 当前 线程 制作 一 个 对 象 副本 ， 然 后 将 其 值 拷贝 到 该 副本 中 ， 此 后 ， 
无 论 在 线程 中 如 何 修改 副本 值 ， 其 声明 的 原版 对 象 的 值 是 不 受 影响 的 。 
因此 ，_Thread_ local 对 象 也 被 称 为 线程 私有 对 象 。 











代码 清单 11-11 展 示 了 _Thread_ local 对象 的 特征 与 使 用 方式 。 


代码 清单 11-11 _Thread_local 对 象 的 使 用 





#include <stdio.h> 
#include <stdbool.h> 
#include <pthread.h> 








// 声明 一 个 静态 _Thread_local 对 象 ta， 它 具有 内 部 连接 。 
// 此 外 ， 它 是 原 县 的 Thread_local 对 象 
static _Thread_ local volatile int ta = 1; 
























































// 声明 一 个 静态 布尔 对 象 jscomplete， 此 对 象 用 于 标识 用 户 线程 是 否 执 行 完 的 标志 
static wise bool isComplete = false; 












































/** 这 是 一 个 用 户 线程 处 理 函 数 ， 用 于 执行 一 个 用 户 线程 分 派 的 任务 */ 
static void* MyThreadProcedure(void* param) 
{ 
// 在 启动 用 户 线程 之 前 ， 
// 系统 会 将 文件 作用 域 声明 的 静态 ta 对 象 复制 到 当前 线程 作为 一 个 副本 。 


// 因此 ， 一 开始 在 当前 用 户 线程 中 ta 副本 的 值 为 1 
printf("Firstly, bs in user thread is: %d\n", ta); 













































































线程 的 ta 副本 赋值 为 109 





// 这 里 将 当前 
ta = 100; 





酒 














printf("ta in user thread = %d\n", ta); 


// 将 用 户 线程 执行 完成 标志 设置 为 true 
isComplete = true; 












































return NULL; 


int main(int argc, const char* argv[]) 


// main 函 数 的 执行 是 在 主线 程 上 
// 一 开始 静态 _Thread 1ocal 对 象 ta 被 复制 到 当前 线程 ， 

// 那么 主线 程 就 有 了 ta 的 一 个 副本 。 尽 管 我 们 在 主线 程 中 仍然 可 以 引用 ta， S 
// 但 它 已 经 不 是 之 前 在 文件 作 | 域 声 明 的 那个 ta 了 ， 而 是 在 主线 程 中 的 一 个 独立 副本 
printf("ta = %d\n", ta); 


// 这 里 将 主线 程 的 ta 副本 赋值 为 20 
ta = 20; 














































































































pthread_t thread = NULL; 
// 创建 用 户 线程 执行 
pthread_ create(&thread, NULL, &MyThreadProcedure, NULL); 





























// 等 待 用 户 线程 执行 完毕 
while( !isComplete); 


// 输出 主线 程 中 ta 副本 的 值 


printf("ta in main thread = %d\n", ta); 





























代码 清单 11-11 使 用 了 现在 几乎 所 有 类 Unix 操 作 系统 自 带 的 pthread 
库 ，Windows 系 统 也 有 对 pthread 的 文 持 ， 但 可 能 需要 开发 者 自己 添加 
pthread 的 连接 库 。 如 果 各 位 无 法 正常 编译 连接 代码 清单 11-11， 可 以 在 
网 上 查询 如 何 使 用 pthread 库 ， 这 方面 的 资料 非 党 多。 此外， 代码 清单 
11-11 中 还 用 到 了 volatile 关 键 字 ， 此 关键 字 将 在 12.2 节 做 详细 介 





11.7 本 普 让 年 





本 章 主 要 给 大 家 介绍 了 C 语 言 代码 编译 的 上 下 文 以 及 不 同 种 类 的 对 
象 、 存 储 空间 在 运行 时 的 行为 和 生命 周期 。 通 过 本 章 学 习 ， 大 家 可 以 党 
握 如 何 控制 好 对 象 与 函数 的 连接 ， 应 该 对 公共 开放 的 函数 和 全 局 对 象 作 
为 外 部 连接 进行 声明 ， 而 仪 在 单个 源 文件 内 使 用 的 函数 和 对 象 应 该 使 用 
内 部 连接 。 此 外 ， 在 函数 中 声明 的 局 部 对 象 在 出 了 相应 的 语句 块 之 后 ， 
其 生命 周期 即 结束 。 如 果 要 持续 保留 对 象 的 有 效 性 ， 应 该 使 用 动态 分 配 
存储 空间 。 男 外 ， 如 果 需 要 一 个 很 大 的 内 存 作 为 缓存 使 用 也 应 该 使 用 动 
态 分 配 的 存储 空间 ， 因 为 一 个 函数 的 栈 空间 往往 比较 小 。 而 对 于 文件 作 
用 域 声 明 的 全 局 对 象 以 及 静态 对 象 则 具有 整个 程序 的 生命 周期 。 











在 本 章 最 后 一 节 谈 到 了 _Thread local 对 象 ， 这 种 类 型 的 对 象 是 声明 
并 初始 化 了 之 后 ， 它 的 值 不 会 被 修改 。 当 每 个 线程 在 执行 之 前 ， 系 统 都 
会 将 该 对 象 的 值 拷贝 到 当前 线程 的 特定 存储 空间 ， 作 为 当前 线程 的 一 个 
副本 使 用 ， 所 以 每 个 线程 内 对 该 对 象 标识 符 的 引用 其 实 都 是 当前 线程 对 
它 所 拥有 的 相应 对 象 副本 的 操作 ， 不 会 影响 到 全 局 声明 的 对 象 本 身 。 不 
过 当前 支持 _Thread_local 的 主流 编译 器 有 GCC 和 Clang， 其 他 编译 器 可 
能 对 该 特性 的 支持 比较 有 限 。 如 果 大 家 在 用 GCC 4.9 或 更 高 版 本 ， 或 者 
是 Clang 3.7 (或 Apple LLVM 7.0) 或 更 高 版 本 ， 则 可 以 放心 大 胆 地 使 
用 。 
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第 12 章 CC 语言 中 的 类 型 限定 符 





C 语 言 中 的 类 型 限定 符 (type qualifier) 用 于 指明 一 个 对 象 的 访 存 属 
性 。C11 标 准 中 一 共 含 有 4 种 类 型 限定 符 ， 分 别 是 const、volatile、restrict 
以 及 _Atomic。 除 了 _Atomic 这 一 类 型 限定 符 比 较 特殊 外 ， 对 于 其 余 三 个 
类 型 限定 符 ， 当 一 个 对 象 为 指针 类 型 的 对 象 时 ， 类 型 限定 符 与 * 写 之 间 
的 摆 放 位 置 不 同 ， 访 限定 符 所 修饰 的 类 型 也 会 有 所 不 同 。 此 外 ， 这 些 类 
型 限定 符 可 著 加 使 用 。 











我 们 将 在 12.1 节 中 详细 描述 除 _Atomic 以 外 的 其 他 三 种 类 型 限定 符 
的 摆 放 位 置 与 修饰 类 型 之 间 的 关系 ， 后 面 几 市 将 不 再 次 述 。 而 类 型 限定 
符 的 摆 放 与 对 类 型 的 修饰 也 是 C 语 言 中 的 难点 之 一 ， 和 希望 各 位 能 仔细 阅 


读 12.1 节 中 的 内 容 。 


12.1 const 限定 符 








const 限 定 符 用 于 修饰 一 个 对 象 ， 表 明 该 对 象 是 一 个 当量 
《constant) 。 被 const 修 饰 的 对 象 只 能 初始 化 一 次 ， 之 后 它 的 值 就 不 能 
被 修改 。 在 很 多 组 入 式 系 统 中 ， 全 局 const 对 象 可 能 会 与 代码 一 起 被 存 入 
ROM 存 储 介质 中 。 





当 const 限 定 符 用 于 修饰 一 个 对 象 时 ， 如 果 将 它 放 置 于 紧 挨 着 对 象 标 
识 符 的 前 面 ， 那 么 表明 该 const 修 饰 此 对 象 本 身 ， 该 对 象 的 值 就 不 能 被 修 
改 。 在 这 种 情况 下 ，const 也 可 以 放置 在 类 型 的 前 面 。 像 下 面 两 条 语句 分 
别 将 对 象 a 与 对 象 b 声 明 为 常量 对 象 。 






































int const a = 100; // 这 里 声明 常量 对 象 a， 有 int 类 型 
const float b = 10.5f， // 这 里 声明 常量 对 象 b， 有 float 类 型 
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上 述 代码 中 ， 无 论 是 对 象 a 还 是 对 象 b， 都 不 能 对 它们 的 值 进行 修 
改 。 倘 知 通 过 指针 做 间接 引用 进行 修改 ， 那 么 行为 是 未 定义 的 ， 比 如 以 
下 代码 片段 : 



































int const a = 10; // 定义 了 常量 对 象 a 
void *p = (void*)&a; // 这 里 通过 万 用 指针 对 象 p 指 向 对 象 a 的 地 址 
*(int*)p += 10; // 然后 通过 第 针 p 来 修改 对 象 a 的 值 











我 们 尝试 在 东 个 函数 中 编写 上 述 代码 然后 运行 ， 在 一 般 时 面 操作 系 
统 中 常量 对 象 的 值 往往 会 变 为 20， 由 于 常量 对 象 的 存储 空间 在 栈 空 








间 ， 栈 存储 空间 本 身 是 一 个 可 读 可 写 的 存储 空间 ， 因 此 在 这 种 情况 下 即 
便 C 语 言 编译 器 会 对 常量 对 象 在 编程 语言 语法 上 进行 保护 ， 但 也 不 能 保 
证 在 运行 时 常量 对 象 的 值 一 定 是 不 变 的 。 不 过 我 们 仍然 不 应 该 通过 这 种 
方式 去 修改 一 个 常量 对 象 。C 语 言 标准 明确 指出 ， 通 过 指针 解 引用 
Cdereference) 的 方式 去 修改 一 个 常量 对 象 ， 其 行为 是 未 定义 的 。 所 
谓 “ 解 引用 ?是 指 通过 对 指针 对 象 做 间接 操作 以 访问 该 指针 所 指 对 象 的 
值 。 当 然 ， 在 某 些 租 入 式 系统 中 ， 如 果 对 一 个 存 入 ROM 的 全 局 常量 对 
象 进行 修改 ， 那 么 在 运行 时 该 常量 的 值 要 么 不 变 ， 即 该 操作 被 存储 器 控 
制 器 视 作 为 一 个 无 效 操作 ， 要 么 系统 直接 发 生 异 常 。 








这 里 再 谈 谈 const 的 位 置 放置 问题 。 在 大 部 分 源 代码 中 ， 我 们 会 看 到 
const 修 饰 一 个 对 象 时 ， 往 往 会 放 在 类 型 的 前 面 。 但 在 后 面 与 指针 类 型 结 
合 的 时 候 我 们 会 发 现 ， 将 const 紧 挨 铸 放置 于 它 所 修饰 的 对 象 标识 符 之 
前 ， 更 容易 判断 当前 修饰 的 是 哪个 类 型 ， 或 者 说 哪 一 层 解 引 用 被 视 作 一 


个 入 


tn 


O 


const 可 以 用 于 修饰 任 一 类 型 的 对 象 ， 包 括 基 本 类 型 ， 枚 举 、 结 构 
体 、 联 合体 等 用 户 目 定义 类 型 ， 以 及 各 种 指针 类 型 和 数组 元 素 类 型 。 这 
里 需要 注意 是 ， 由 于 数组 对 象 本 号 其 地 址 是 固定 不 变 的 ， 数 组 对 象 仅 仪 
表征 了 一 段 存储 空间 的 首 地 址 以 及 对 其 元 素 的 访问 模式 ， 所 以 C 语 言 中 
没有 一 种 限定 符 能 用 于 修饰 数组 对 象 本 里， 限定 符 只 能 用 于 修饰 数组 元 
素 。 








下 面 将 分 别 介绍 const 限 定 符 如 何 修饰 普通 标量 对 象 、 数 组 元 素 、 指 
针 类 型 的 对 象 ， 以 及 修饰 后 的 对 象 的 访问 状态 。 


12.1.1 const 限 定 符 修 饰 普通 对 象 
当 const 修 饰 一 个 普通 对 象 时 ， 该 对 象 的 值 将 不 能 被 修改 。 当 一 个 


const 修 饰 一 个 复合 类 型 对 象 时 比如 一 个 结构 体 对 象 )， 那 么 该 结构 体 
对 象 中 的 所 有 成 员 的 值 都 不 能 被 修改 。 








代码 清早 12-1 将 展示 这 些 常量 对 象 的 声明 与 使 用 。 


代码 清单 12-1 const 修饰 普通 对 人 象 





#include <stdio.h> 


int main(int argc, const char* argv[]) 








// 声明 了 一 个 int 类 型 的 常量 对 象 a， 但 没有 对 它 初始 化 
int const a; 


// 即便 如 此 ， 我 们 也 不 能 再 对 常量 对 象 a 进 行 赋值 ， 因 此 以 下 这 条 表达 式 是 错误 的 : 
a = 100; 


// 声明 了 一 个 常量 枚 举 对 象 6e， 并 用 MY_ENUM2 枚 举 值 对 它 初 始 化 
enum { MY_ENUM1, MY_ENUM2 } const e = MY_ENUM2， 


匿名 结构 体 ， 并 用 它 声 明了 一 个 常量 结构 体 对 象 sS， 这 里 的 const 也 能 放 在 struct 前 面 
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// 定义 了 一 
struct 


{ 





























int a; 

struct 
float f; 
double d; 


}inner; 
} const s={ .a= 10, .inner = { 10.5f, -20.5 } }; 


// 这 里 对 结构 体 对 象 s 中 的 任 一 成 员 ， 包 括 其 内 嵌 类 型 的 成 员 ， 都 不 能 修改 


s.inner.d = 30; // 这 条 语句 是 错误 的 























printf("result = %.1f\n", e + SsS.a + S.inner.f - s.inner.d); 
struct Object 
{ 


int a, b; 
const int c; // 这 里 成 员 对 象 c 是 一 个 常量 




















struct Object obj = yD 0 0, 30 }; 

obj.a += obj.b; 语句 没 问题 

4 DR 这 条 时 和 交 全 出 现 及 全 报 和 

因为 0bject 结 构 体 中 的 成 员 对 象 c 是 常量 ， 所 以 它 的 值 不 能 被 修改 
obj.c += 10; 




















代码 清单 12-1 简 单 地 介绍 了 const 修 饰 一 个 普通 类 型 的 对 象 的 使 用 情 
景 。 这 里 很 明确 地 描述 了 当 const 修 饰 一 个 复合 类 型 时 的 特性 。 


下 面 我 们 将 描述 const 修 饰 数 组 元 素 的 情况 


12.1.2 const 限 定 符 修 饰 数组 元 素 


在 C 语 言 中 ， 一 个 数组 对 象 仅 仪表 征 了 对 一 个 连续 存储 空间 的 引 
用 ， 所 以 在 C 语 言 实现 中 ， 一 个 数组 对 象 的 地 址 与 其 起 始 元 素 的 首 地 址 
都 是 同一 个 地 址 ， 并 且 一 个 数组 对 象 本 喘 不 具有 "“ 值 > 这 个 概念 。 因 此 ， 
任 一 限定 符 都 不 能 用 于 修饰 一 个 数组 对 象 ， 而 只 能 用 于 修饰 数组 对 象 的 
元 素 。 











代码 清单 12-2 展 示 了 const 修 饰 数组 元 素 的 方式 以 及 效果 。 


代码 清单 12-2 ”const 修 饰 数 组 对 象 元 素 





#include <stdio.h> 


int main(int argc, const char* argv[]) 


// 声明 了 一 个 带 有 5 个 const int 类 型 元 素 的 数组 对 象 a 
// 这 里 的 const 修 饰 的 是 a[i]， 而 不 是 a 自身 
int const a[] = { 1, 2, 3, 4, 5 }; 









































// 以 下 这 条 语句 将 产生 编译 错误 ， | 
// 因为 数组 对 象 a 中 的 每 个 元 素 都 是 常量 ， 不 能 被 修改 
a[QO]++; 





























// 这 里 首先 定义 了 一 个 匿名 枚 举 ， 然 后 用 该 枚 举 类 型 声明 了 一 个 
// 带 有 3 个 常量 元 素 的 数组 对 象 e。e 的 每 个 元 素 类 型 为 const 枚 举 类 型 ， 
// 这 里 的 const 也 能 放 在 enum 之 前 
enum { MY_ENUM1，MY_ENUM2， MY_ENUM3 } 

const e[] = { MY_ENUM1, MY_ENUM2, MY_ENUM3 }; 


















































e[1] = MY_ENUM3; // 这 条 语句 也 是 无 法 通过 编译 的 


// 这 里 定义 了 一 个 UN 联合 体 类 型 ， 并 用 该 类 型 声明 了 一 个 带 有 2 个 常量 元 素 的 数组 对 象 u。 
// u 的 每 个 元 素 的 类 型 为 const union UN， 这 里 的 const 也 能 放 在 union 之 前 。 
union UN { int a; float f; 

const u[] = { {.a = 10}, {.f = 2.5f} }; 

































































u[1].f = 0.0f; // 这 条 语句 也 无 法 通过 编译 














printf("The value is: %,1fxn"，a[0] + e[1] + u[1].f); 





通过 代码 清单 12-2 的 例子 我 们 可 以 看 到 ，const 修 饰 一 个 数组 对 象 
时 ， 产 生 作 用 的 是 该 数组 中 的 每 个 元 素 。 然 而 ， 对 于 像 代 码 清单 12-2 中 
数组 对 象 a 的 类 型 ， 它 仍然 被 表达 为 const int[5]， 表 示 具 有 5 个 const int 类 
型 元 素 的 数组 。 我 们 要 查看 上 述 数 组 对 象 类 型 的 话 其 实 非常 方便 ， 比 如 
我 们 要 查看 数组 对 象 8 的 类 型 ， 我 们 在 声明 数组 对 象 语 句 下 面 写 一 句 : 
at++; 。 然 后 ， 编 译 器 会 提示 编译 出 错 信 息 


of type'const int[5]， 这 就 说 明 数 组 对 象 a 的 类 型 为 const int[5] 了。 


Cannot increment value 








下 面 我 们 将 描述 const 所 使 用 的 最 复杂 的 情景 一 一 与 指针 类 型 混用 。 


12.1.3 _ const 限定 符 修饰 指针 次 型 对 象 





在 C 语 言 中 ， 限 定 符 修 饰 一 个 对 象 是 一 个 非常 神奇 的 设 定 ， 这 种 神 
奇 不 亚 于 指向 数组 的 指针 与 指向 函数 的 指针 这 种 表达 形式 。 我 们 之 前 已 
经 描述 了 const 修 饰 一 个 普通 对 象 的 例子 ， 比 如 
将 对 象 a 指 定 为 一 个 常量 ， 对 象 a 的 类 型 为 const int。 而 且 这 里 const 与 int 
之 间 的 位 置 可 以 互 换 ， 不 影响 语义 。 而 当 const 要 修饰 一 个 指针 类 型 的 对 
象 时 ， 内 容 就 丰富 了 。 这 里 涉及 一 个 问题 ， 我 们 需要 指定 是 将 指针 对 象 
本 号 指定 为 常量 还 是 将 该 指针 对 象 做 了 间接 操作 之 后 的 值 作为 常量 ， 或 
是 将 两 者 同时 作为 常量 。 下 面 我 们 将 分 别 列 出 这 三 种 表达 方式 。 


const int a=10; 表示 























int * const pl; // 指定 指针 
int const * p2; // 指定 指针 
int const * const p3; // 指定 指针 


| 象 p1 为 常 
| 象 p2 做 间 
| 象 p 类 和 


和 
和 




















接 操作 后 的 值 作为 常量 
量 ， 并 且 对 它 做 间接 引用 后 的 值 也 作为 常量 
































我 们 先 对 比 看 一 下 上 述 代 码 片 段 中 的 p1 对 象 。 这 里 const 修 饰 的 是 pl 
旨 针 对 象 ， 说 明 p1 指 针对 象 自身 是 一 个 常量 ， 这 意味 着 p1 一 旦 被 声明 ， 
它 的 值 就 不 允许 被 修改 ， 比 如 : p1=NULL;， 这 条 语句 就 是 错误 的 。 也 
就 是 说 它 不 能 指向 其 他 地 址 ， 但 是 对 *p1 可 以 做 修改 ， 比 如 : *p1=20; 
这 完全 可 行 。 我 们 看 到 ， 修 饰 p1 指 针对 象 的 const 紧 靠 在 p1 对 象 标识 符 之 
前 《 即 在 p1 的 左 侧 位置 ) ， 并 且 在 * 号 之 后 〈 即 在 * 的 右 侧 位 置 》， 此 时 


pl 的 类 型 为 int*const。 

















p2 指 针对 象 不 是 一 个 常量 ，const 修 饰 的 是 (*p2) ， 说 明 对 p2 做 间 
接 操 作 后 ， 其 值 为 一 个 和 常量， 不 允许 对 它 进 行 修改 。 也 就 是 说 ， 像 
p2=NULL; 这 条 语句 是 完全 有 效 的 ， 而 像 *p2=10; 这 条 语句 则 是 非法 


的 。p2 对 象 的 类 型 为 const int* 。 


p3 指 针对 象 是 一 个 稼 量 ， 并 且 对 它 做 间接 操作 后 的 值 也 是 一 个 党 
量 。 这 意味 着 ， 像 p3=NULL; 以 及 *p3=10; 这 些 都 是 非法 的 。p3 指 针 
对 象 的 类 型 为 const int*const。 


通过 上 述 三 个 指针 对 象 的 不 同 例子 ， 我 们 可 以 友 现 const 限 定 符 在 修 
饰 一 个 指针 对 象 时 所 产生 的 丰 寅 多样 性 。 这 里 大 家 要 记 住 的 是 ， 在 声明 
一 个 指针 对 象 时 ， 当 const 限 定 符 摆 放 在 所 有 * 写 的 后 面 、 紧 徘 在 对 象 标 
识 符 之 前 ， 那 么 该 const 限 定 符 修饰 的 是 指针 对 象 本 身 ， 即 指针 对 象 不 能 
指 回 其 他 任何 对 象 ， 它 的 值 不 能 被 修改 。 当 const 摆 放 在 最 靠近 对 象 标识 
符 的 * 号 之 前 时 ，const 修 饰 的 实际 上 是 * 连 同 其 后 面 的 对 象 标识 符 ， 就 比 
如 〈*p) 的 值 ， 也 就 是 说 对 郑 的 值 不 能 进行 修改 。 








所 以 从 const 所 修饰 的 对 象 来 看 ， 我 们 束 可 以 看 它 后 面 的 * 写 位 置 。 
如 宁 它 后 面 没 有 * 号 ， 那 么 修饰 的 就 是 对 象 本 身 ， 人 否则 它 修 饰 的 就 是 所 
有 在 此 对 象 标识 符 之 前 、const 之 后 的 * 做 间接 操作 之 后 的 对 象 值 。 像 
const intt*pp; 这 里 pp 与 〈*pp) 都 不 是 常量 ， 只 有 〈**pp) 才 是 常量 。 








除了 从 const 所 修饰 对 象 的 标识 符 这 个 视角 看 之 外 ， 还 能 通过 const 
修饰 的 类 型 来 看 。 


比如 : pl 是 int*const 类 型 ， 我 们 看 const 前 面 的 类 型 ， 这 里 是 int*， 


所 以 很 显然 这 里 的 int* 类 型 的 对 象 是 常量 ， 不 可 被 修改 ， 也 就 是 p1 对 象 





目 喘 ， 因 为 p1 的 类 型 去 除 限 定 符 之 后 束 是 int* 类 型 。 所 以 从 类 型 角度 看 
的 话 就 是 要 看 const 之 前 的 类 型 。 


然后 我 们 看 p2 的 类 型 ， 它 是 const int+， 我 们 不 妨 把 const 与 int 交 换 一 
下 位 置 ， 这 里 的 交换 是 不 会 影响 语义 的 ， 只 要 不 涉及 越过 * 号 的 交换 。 
我 们 看 到 p2 的 类 型 可 描述 为 int const*， 我 们 看 摆 放 在 const 前 面 的 类 型 是 
int， 所 以 这 里 对 于 p2 对 象 而 言 ， (*p2) 是 一 个 常量 ， 它 是 const int 类 
型 。 


这 么 一 来 ， 当 我 们 要 声明 一 个 指针 对 象 ， 它 自身 是 一 个 常量 还 是 说 
对 它 做 间接 操作 之 后 的 对 象 是 一 个 常量 就 有 两 种 方式 去 判别 了 。 当 然 ， 
一 般 我 们 用 这 种 类 型 判别 作为 一 种 验证 方式 ， 我 们 在 思考 时 还 是 首选 上 
一 段 所 描述 的 const 限 定 哪个 对 象 的 方法 ， 不 过 主要 还 在 于 上 自己 怎么 思考 
和 理解 ， 而 不 用 去 强求 采用 哪 种 方式 。 当 我 们 确定 了 * 相 对 于 const 的 位 
置 之 后 也 就 能 确定 当前 的 const 修 饰 的 是 哪 种 类 型 一 一 const 修 饰 的 是 跟 
在 它 后 面 的 连同 * 包 含 在 一 起 的 那个 对 象 。 像 对 于 p1 来 说 ，const 后 面 就 
是 p1， 所 以 此 时 const 修 饰 的 就 是 p1 对 象 ， 而 p1 对 象 的 类 型 就 是 
int*const; 对 于 p2，const 后 面 跟 的 是 *p2， 所 以 const 修 饰 的 就 是 
Crp2) ， 而 《〈*p2) 的 类 型 很 显然 就 是 const int， 对 于 p3 则 有 两 个 
const， 最 前 面 的 const 后 面 跟着 的 是 〈*const p3) ， 所 以 〈*p3) 就 是 常 
量 类 型 ， 即 const int; 而 后 一 个 const 紧 贴 着 p3， 说 明 它 修饰 的 就 是 p3 对 
象 ， 所 以 p3 自 身 就 是 一 个 常量 ， 这 么 一 来 ，p3 的 类 型 就 是 const 











int*const。 这 里 我 们 可 以 发 现 ， 当 对 一 个 对 象 做 一 次 间接 操作 之 后 ， 比 
如 〈*p3) ， 其 类 型 就 看 该 * 之 前 的 部 分 ， 而 * 之 后 的 所 有 限定 符 都 可 以 
直接 无 视 ， 所 以 (*p3) 的 类 型 就 是 const int，* 后 面 的 const 可 以 无 视 
之 。 而 p3 类 型 则 需要 把 所 有 的 const 限 定 符 都 这 上 。 








另外 ， 我 们 还 能 观察 到 这 么 一 个 用 来 判定 当前 对 象 的 值 是 售 可 修改 
的 规律 : 如 果 当 前 对 象 标识 符 的 前 面 紧 贴 着 const， 那 么 该 对 象 的 值 无 法 
修改 ， 如 果 前 面 紧 贴 着 的 是 *， 那 么 该 指针 对 象 的 值 则 可 修改 。 比 如 p1 
之 前 紧 贴 厦 const， 所 以 p1 的 值 无 法 被 修改 ， 而 p2 之 前 紧 贴 着 的 是 *， 所 
以 p2 可 被 修改 ， 但 是 (*p2〉 前 面 束 紧 贴 着 const 了 ， 所 以 (*p2) 的 值 就 
不 能 被 修改 了 。 


当 我 们 掌握 了 这 些 识别 const 如 何 修饰 指针 对 象 的 技巧 之 后 ， 我 们 可 
以 来 点 更 复杂 的 情况 。 请 见 代码 清单 12-3。 





代码 清单 12-3” ”const 修饰 指针 对 象 的 综合 情况 





#include <stdio.h> 



































// 这 里 定义 了 一 个 dummy 函 数 ， 稍 后 会 用 至 
static void dummy(int a) 


a 


printf("param a = %d\n", a); 


int main(int argc, const char* argv[]) 


// 声明 一 个 常量 对 象 a， 并 将 它 初始 化 为 19 


const int a = 10; 


// 声明 一 个 普通 对 象 b， 并 将 它 初始 化 位 29 
int b = 20; 


// 声明 一 个 变量 指针 对 象 p， 并 用 ee 初始 化 


int const *p = &a; 类 型 为 const int * 




































































*p = 20; // 这 人 句 非 法 ! (*p ) 是 一 个 常量 


p = &b， 









































// 这 人 句 没 问题 








// 声明 了 一 个 常量 指针 对 象 9， 并 用 对 象 p 的 地 址 对 其 初始 化 
q b; // qd 的 类 型 为 int * const 


int * peel 


q = NULL; 
*q += 10; 





// 这 名 非法 ! q 是 一 个 常量 


// 这 人 句 没 问题 























// 这 里 声明 了 一 个 变量 指针 对 象 cpp， 并 | 























// 注意 ， 这 里 的 const 修 饰 的 是 (**cpp) 

















// 此 外 ， 这 里 (*cpp) 的 类 型 为 const int *， 


int const **cpp = &p; 
“cpp = &a; 
if(p == &a) 
puts("p points to a!"); 


cpp = NULL; 
**cpp = 0; 


























其 值 不 能 


被 修改 











al 





间 针 对 象 p 的 地 址 对 它 初始 化 ， 


， 只 有 (**cpp) 不 能 被 修改 。 








// cpp 的 类 型 为 const int ** 




















// 这 里 通过 间接 操作 ， 

















// 这 人 句 没 有 问题 














// 这 人 句 错 误 ! 因为 





























// 这 里 声明 了 一 个 常量 指针 对 象 cqq， 并 | 

















// int* 后 面 的 const 修 饰 的 是 (*cqq)， 














// 也 就 是 说 ， 这 里 (*cqq) 的 类 型 为 jnt * const， 


int* const * const cqq = &q; 
**cqq += 100; // 这 句 没 
printf("b = = %d\n", b); 


问题 












































(**cpp) 的 类 型 为 const int 


其 值 不 能 被 修改 


使 得 指针 对 象 p 又 指向 了 a 








型 为 int 


为 (**cpp) 是 一 个 常量 


指针 对 象 q 的 地 址 对 它 初始 化 。 
// cqq 前 的 const 修 饰 的 是 cqq， 说 明 cqq 自 身 是 一 个 常量 ， 

说 明 (*cqdq) 也 是 一 个 常量 。 
(**cqq) 的 类 


// cqq 的 类 型 为 jnt * const * const 





，(**cqq) 的 类 型 是 





起 Int， 


不 是 一 个 常量 


*cqq = NULL; // 这 人 句 错误 ! (*cqq) 的 类 型 为 jnt * const， 是 一 





cqq = NULL; // 这 名 背 误 ! cqq 的 类 型 


// 声明 一 个 数组 对 象 arr， 它 含有 3 个 int 
int arr[3] = { 1, 2, 3 了 ， 























类 型 的 元 素 


// 这 里 声明 了 一 个 常量 指针 对 象 pArray， 指 向 数组 对 象 arr 的 地 址 ， 
// pArray 的 类 型 为 int (* const)[3]， const 修 饰 的 是 pArray 对 象 标识 符 ， 














// 这 岂 说 明 const 修 饰 的 类 型 为 jnt (* )[ 
int (* const pArray)[3] = &arr; 











I 为 int * const * const, 

















3]， 即 pArray 自 身 是 








(*pArray)[1] = 0;  // 0K, 没有 问题 
pArray = NULL; // 这 句 话 则 是 非法 的 ，pArray 是 常量 











printf("arr[1] = %d\n", arr[1]); 














个 常量 











// 这 里 声明 了 一 个 指向 函数 的 指针 常量 对 象 pFunc。 

// 这 里 的 const 修 饰 的 是 pFunc 标 识 符 ， 说 明 pFunc 自 身 是 一 个 
// const 所 修饰 的 类 型 则 是 void (*)(int) 

void (* const pFunc)(int) = &dummy; 

pFunc (100); // 没 问 题 

pFunc = NULL; // 语法 错误 ! pFunc 是 常量 ， 其 值 不 允许 被 修改 






























































值 不 允 询 








F 被 修改 

















其 值 不 允许 被 修 











代码 清单 12-3 中 也 体现 了 如 何 去 判 定 一 个 指针 对 象 的 党 








量 情况 。 正 


如 之 前 提 到 的 ， 对 于 从 const 修 饰 哪个 对 象 而 言 则 是 看 const 后 面 的 * 号 情 


况 。 我 们 把 const 后 面 的 * 号 


p; 





连同 对 象 标识 符 一 起 放 进 去 看 ， 比 如 像 对 象 


它 的 声明 符 中 const 后 面 有 一 个 * 号 ， 那 么 这 个 const 就 修饰 了 整个 


(*p) ， 说 明 (*p) 是 一 个 常量 。 而 对 于 指针 对 象 9，const 后 面 就 只 有 
一 个 对 象 标识 符 d9， 说 明 const 修 饰 的 就 是 q 本 身 ， 那 么 q 咕 是 一 个 向 量 ， 


而 《*q)〉 则 不 是 常量 。 


对 于 一 个 指针 对 象 被 多 个 const 修 饰 的 情况 我 们 也 无 需 慌张 ， 我 们 可 
以 从 右 往 左 看 各 个 const 修 饰 的 对 象 是 啥 。 当 我 们 在 看 某 个 const 修 饰 哪 
个 对 象 时 可 把 其 余 的 const 全 都 忽略 。 比 如 我 们 看 代码 清单 12-3 中 的 cqd 
这 个 比较 复杂 的 指针 对 象 ， 首 先 在 cqq 之 前 有 一 个 const 限 定 符 ， 说 明 这 
个 const 修 饰 的 就 是 cqq 自 身 。 而 对 于 int* 后 面 的 那个 const， 我 们 从 这 个 
const 位 置 起 从 左 往 右 看 ， 可 以 看 到 const 后 面 跟着 的 是 *const cqq。 正 如 
之 前 所 说 的 ， 我 们 把 * 之 后 的 const 都 忽略 掉 可 得 到 : *cqq， 说 明 这 里 * 之 
前 的 const 修 饰 的 是 (*cqq) ， 这 意味 着 〈*cqq) 的 值 不 允许 被 修改 。 而 
对 于 (**cqq) ， 由 于 最 左边 的 * 前 面 没有 const 修 饰 ， 所 以 它 不 是 常量 ， 
(**cqq) 的 值 可 以 被 修改 。 








代码 清单 12-3 也 描述 了 对 于 指向 数组 的 指针 对 象 以 及 指 回 函数 的 指 
针对 象 如 何 用 const 修 饰 。 其 实 原理 也 一 样 ， 直 接 在 指针 对 象 标识 符 前 添 
加 const 即 可 。 


以 上 讲 的 是 const 如 何 修饰 一 个 指针 对 象 的 问题 ， 而 对 于 整个 C 语 言 
类 型 系统 而 言 还 有 一 个 比较 重要 的 问题 是 一 一 如 何 匹 配 一 个 含有 const 修 
饰 的 对 象 类 型 。 这 里 除了 涉及 C 语 言 的 类 型 系统 之 外 ， 还 涉及 一 个 类 型 
安全 问题 。 比 如 次 ， 我 们 声明 了 一 个 币 量 对 象 const int a=10; ， 如 果 用 





它 赋值 给 另 一 个 普通 变量 对 象 ， 这 是 完全 没有 问题 的 ， 比 如 : int 

b=a; 。 因 为 无 论 变量 b 如 何 修改 其 值 ， 常 量 a 的 值 是 不 会 受到 影响 的 。 
但 如 果 用 一 般 的 指针 对 象 ( 如 int*p=&a; ) 去 指向 某 个 常量 对 象 会 发 生 
什么 呢 ? 当 我 们 对 指针 对 象 p 采 用 间接 操作 符 来 修改 值 的 时 候 ， 比 如 
*p=20; 此 时 对 象 a 的 值 就 被 改变 了 ， 这 与 对 象 a 作 为 常量 这 一 属性 是 相 
违背 的 。 所 以 在 C 语 言 中 ， 对 一 个 常量 对 象 做 取 地 址 操作 之 后 的 指针 类 
型 是 在 const 后 面 直 接 加 * 号 。 比 如 对 于 “const type obj; ”，&obj 的 类 型 就 
是 const type*。 这 么 做 可 使 得 对 该 指针 类 型 做 间接 操作 之 后 仍然 保持 常 
量 类 型 。 所 以 像 上 面 的 const int a; &a 的 类 型 为 const int*， 当 然 表 示 为 
int const* 则 更 容易 做 类 型 判定 。 而 一 个 const int* 类 型 的 指针 对 象 是 不 能 
赋值 给 一 个 int* 类 型 的 指针 对 象 的 ， 除 非 用 投射 操作 做 类 型 强制 转换 。 
我 们 在 判定 一 个 对 象 取 其 地 址 之 后 的 类 型 的 方法 也 很 简单 一 一 直接 将 原 
本 对 象 的 标识 符 变 为 * 号 即 可 。 比 如 ， 这 里 的 a 声明 为 const int a， 那 么 取 
其 地 址 之 后 ，&a 的 类 型 则 是 const int* 〈 把 a 变 成 了 * ) 。 而 对 于 代码 清单 
12-3 中 的 g， 它 声明 为 int*const qg， 那 么 取 其 地 址 之 后 ，&q 的 类 型 为 
int*const* (把 q 变 成 了 *) 。 











正 由 于 存在 类 型 安全 问题 ， 所 以 等 号 操作 符 的 左边 表达 式 的 类 型 如 
何 去 匹 配 等 号 操作 符 右 边 表达 式 的 类 型 有 一 定 学 问 。 正 如 上 一 段 所 述 ， 
等 写 操作 符 右 边 的 const int* 类 型 不 能 隐 式 转换 为 等 号 操作 符 左 边 的 int* 
类 型 ， 然 而 ， 等 写 操 作答 右边 如 果 是 int* 类 型 ， 那 么 可 以 隐 式 转换 为 
const intt 类 型 与 等 号 操作 符 左 边 的 表达 式 匹 配 。 换 句 话 说 ， 低 限定 的 类 


型 可 以 隐 式 转 为 高 限定 类 型 ， 而 高 限定 类 型 则 不 允许 隐 式 转 为 低 限 定 类 
型 。 除 了 这 种 情况 一 一 int** 不 能 隐 式 转换 为 const int** 类 型 。 代 码 清单 
12-4 给 出 了 int** 不 能 隐 式 转换 为 const int** 的 理由 。 





代码 清单 12-4 ”展示 const int** 如 何 巧 妙 地 修改 了 一 个 常量 对 象 的 
值 





#include <stdio.h> 


int main(int argc, const char* argv[]) 

















// 这 里 先 声 明 一 个 常量 对 象 a 
const int a = 10; 


// 这 里 声明 一 个 普通 指针 对 象 p， 初 始 化 为 空 
int *p = NULL; 


// 这 里 声明 一 个 const int** 的 指针 对 象 pp， 指 向 p 的 首 地 址 。 
// 这 里 用 投射 操作 做 类 型 强制 转换 就 是 因为 ， 

// int** 不 能 隐 式 转换 为 const int ** 类 型 。 

const int **pp = (const int**)e&p; 











































































































// 这 里 大 家 注意 于 *pp 的 类 型 是 const int*， 

// &a 的 类 型 由 是 const int*， 所 以 两 者 完全 兼容 。 

// 这 条 语句 执行 之 后 ，p 也 就 被 间接 指向 了 常量 对 象 a 的 地 址 
*pp = 3 &a; 























if(p == &a) 
puts("p points to a!"); 


// 最 后 通过 指针 对 象 p 来 间接 修改 常量 对 象 a 的 值 
*p = 10; 


























printf("a = %d\n", a); 





从 代码 清单 12-4 中 可 以 看 到 ， 人 倘若 int** 能 隐 式 转换 为 const int**， 
那么 我 们 通过 一 个 中 间 普 通 指针 对 象 就 能 绕 过 原先 常量 对 象 的 访问 权 
限 ， 从 而 间接 修改 第 量 对 象 值 的 情况 。 这 里 ， 最 具 破 坏 力 的 语句 就 是 
一 一 *pp=&a; 。 由 于 a 是 一 个 常量 对 象 ， 而 〈《*pp〉 的 类 型 为 const int*， 
完全 与 &a 的 类 型 相同 ， 所 以 这 个 赋值 没有 任何 问题 ， 但 所 呈现 的 问题 

















则 是 这 条 间接 操作 赋值 语句 把 常量 对 象 a 的 地 址 传递 给 了 普通 指向 对 象 
p。 随 后 ， 普 通 指针 对 象 p 可 以 通过 间接 操作 即 可 随意 修改 音量 对 象 a 的 
值 。 





因此 ， 在 C 语 言 中 不 允许 直接 将 int** 隐 式 转换 为 const ints*， 而 只 能 
将 int** 隐 式 转 换 为 const int*const* 类 型 。 如 果 代 码 清单 12-4 中 的 指针 对 
象 pp 的 类 型 是 const int*const*+， 那 么 当 对 pp 做 第 一 次 间接 操作 时 ， 
(*pp》 的 类 型 为 int const*const， 其 值 不 允许 被 修改 ， 从 而 保证 了 无 法 
通过 (*pp) 将 原先 初始 化 时 指向 的 指针 对 象 间接 地 将 它 修改 为 指向 某 


个 常量 对 象 。 


以 上 已 经 基本 把 const 限 定 符 如 何 修饰 一 个 对 象 以 及 修饰 后 所 产生 的 
效果 都 详细 描述 了 。 各 位 在 看 完 这 些 内 容 后 务必 要 反复 实践 ， 这 样 才能 
加 深 对 限定 符 的 了 解 ， 这 块 内 容 也 确实 不 容易 掌握 。 








12.1.4 ”const 限 定 符 修饰 函数 形 参 类 型 为 数组 的 对 
象 


下 面 再 谈 一 下 const 限 定 符 如 何 修 饰 函 数 形 参 为 数组 类 型 的 场合 。 我 
们 在 9.3 市 中 已经 谈 过 ， 一 个 函数 的 形 参 可 以 被 表达 为 一 个 数组 类 型 ， 
但 它 本 质 上 仍然 是 一 个 指针 ， 既 然 是 一 个 指针 ， 那 么 它 跟 原生 的 数组 对 


象 就 会 有 所 不 同 。 前 面 讲 了 ， 原 生 的 数组 对 象 本 映 是 不 可 和 被 修改 的 ， 因 
此 没有 所 谓 的 用 限定 符 修 饰 数组 对 象 的 这 个 概念 ， 然 而 对 于 指针 则 不 

同 ， 指 针对 象 的 值 是 可 被 修改 的 。 如 果 我 们 要 对 以 数组 类 型 呈现 的 函数 
形 参 对 象 施加 const 限 定 ， 使 得 该 形 参 值 无 法 航 修 改 ， 那 么 我 们 只 需要 将 
const 限 定 符 放置 在 [下 标 操作 符 里 面 即 可 。 如 果 [] 中 含有 数值 字面 量 或 
其 他 标识 符 ， 那 么 const 放 在 它们 的 前 面 ， 即 左 侧 位 置 。 代 码 清单 12-5 展 
示 了 const 修 饰 函 数 形 参 为 数组 类 型 的 例子 。 


代码 清单 12-5 ”const 修 饰 函 数 形 参 为 数组 类 型 的 例子 





#include <stdio.h> 


























// 这 里 ， 形 参 a 相 当 于 int * const 类 型 

// i int * 类 型 

// 形 参 c 相 当 于 int const * const 类 型 

static void Fun(int a[const 5], const :int b[3], 
const int c[static const 4]) 





人 WW 
A 















































{ 
a[0]++; // OK! 没有 问题 
a = NULL; // 错误 ! a 是 一 个 常量 指针 对 象 
b[9]++， // 错误 ! b[0] 是 const :int 类型， 一 个 常量 
c[O]++; // 错误 ! c[0] 是 const int 类 型 ， 是 一 个 常量 
c = NULL; // 错误 ! c 本 里 是 一 个 常量 ， 不 能 被 修改 
printf("The sum is: %d\n", a[0] + b[1] + c[2]); 
b = NULL; // OK! 没有 问题 

} 


int main(int argc, const char* argv[]) 


int a[] = { 1, 2, 3, 4, 5 }; 
int b[] = { 7, 8, ; 
int c[] = { 10, 11, 12, 13 }; 


Fun(a, b, c); 





代码 清单 12-5 中 给 出 了 3 种 不 同类 型 的 形 参 ， 我 们 看 每 个 形 参 的 本 





质 类 型 时 也 非常 简单 ， 直 接 将 [去 掉 ， 把 里 面 的 static 等 存储 类 说 明 符 也 
全 都 去 掉 ， 只 留 限定 符 ， 然 后 把 标识 符 变 为 * 号 即 可 。 另 外 ， 如 宁 我 们 
对 使 用 数组 下 标 操 作 符 的 对 象 类 型 是 否 为 一 个 种 量 看 不 清 ， 可 以 把 数组 
下 标 形式 变 为 间接 操作 形式 ， 比 如 a[0]++; 可 以 转换 为 (* (a+0) ) 
++; ， 语 义 是 相同 的 ， 这 样 我 们 就 能 看 到 af[0] 的 类 型 其 实 与 (*a) 一 


样 ， 都 是 int 类 型 ， 而 这 里 const 修 饰 的 是 a 自 身 。 





12.1.5 “类型 限定 符 的 本 质 售 义 


最 后 ， 我 们 来 描述 一 下 类 型 限定 符 的 本 质 含义 。 所 谓 类 型 限定 符 很 
显然 ， 它 主要 是 限定 类 型 的 ， 尽 管 在 文法 上 它 也 可 以 看 作 修 饰 一 个 对 
象 ， 而 像 我 们 上 面 那 种 const 限 定 的 判定 主要 是 以 对 象 作 为 参照 的 ， 这 里 
我 们 将 再 详细 介绍 如 何 根据 类 型 进行 判定 。 类 型 限定 符 所 限定 的 是 类 型 
说 明 符 《比如 基本 类 型 ， 枚 举 、 结 构 体 、 联 合体 等 用 户 自 定义 类 型 ， 还 
有 稍 后 会 讲 的 原子 类 型 说 明 符 ) ， 以 及 与 类 型 说 明 符 相 结合 的 指针 类 
型 。 我 们 假定 有 某 个 含有 N 级 指针 的 类 型 Type (Type 自 身 或 许 也 包含 着 
const 限 定 符 ) ， 那 么 Type const 或 者 const Type 都 表示 类 型 Type 受到 const 
限定 。 然 而 在 C 语 言 中 ， 我 们 只 能 通过 typedef 将 整个 类 型 组 合 为 一 个 类 
型 标识 符 Type， 这 一 点 会 在 下 一 章 描述 。 而 像 const int* 这 个 类 型 ，int* 
没有 被 视 为 一 个 整体 ， 这 里 的 const 限 定 的 仅仅 是 int 类 型 ， 而 不 是 整个 
int* 类 型 。 所 以 ， 在 C 语 言 中 使 用 限定 符 后 置 法 ， 将 int*const 这 种 写法 看 





作为 const 限 定 int* 类 型 。 因 此 我 们 碰 到 除 _Atomic 之 外 的 类 型 限定 符 ， 都 
看 整个 类 型 声明 的 最 右边 的 限定 符 ， 最 右边 的 限定 符 限 定 了 在 它 左 边 的 
所 有 类 型 。 如 果 对 当前 对 象 做 了 N 次 间接 操作 ， 那 么 我 们 就 从 石 往 左 跳 
过 N 个 * 号 ， 看 类 型 限定 符 限 定 的 情况 。 





像 代码 清单 12-5 中 的 Fun 函 数 形 参 对 象 4， 已 知 其 类 型 为 int*const， 
那么 对 于 a 自身 来 襄 ， 其 类 型 最 右边 有 一 个 const， 那 很 显然 ， 它 就 是 一 
个 常量 ， 而 对 于 (*a)》 或 al0] 而 言 ， 我 们 用 了 一 次 间接 操作 符 ， 那 么 我 
们 从 右 往 左 看 跳 过 一 个 * 号 ， 前 面 有 没有 const， 说 明 〈*a) 的 类 型 就 是 
int， 不 是 一 个 第 量 。 同 样 ， 我 们 再 分 析 一 下 形 参 对 象 c， 它 的 类 型 可 以 
通过 上 述 方式 解析 出 来 ， 个 int const*const 类 型 。 那 么 对 于 c 而 言 ， 
它 前 面 就 有 一 个 const， 所 以 c 束 是 一 个 和 常量， 而 对 于 (*c) 或 c[0] 而 言 ， 
做 了 一 次 间接 操作 之 后 看 第 一 个 * 前 面 是 否 跟着 一 个 const， 我 们 看 到 确 


实 有 一 个 const， 所 以 〈*c) 也 是 一 个 常量 ， 其 类 型 为 const int。 





我 们 可 以 再 引申 ， 观 察 代码 清单 12-3 中 的 cpp 和 cqq。cpp 指 针对 象 的 
类 型 为 int const**， 那 么 对 于 cpp 而 言 ， 类 型 最 右边 是 一 个 * 写 而 没有 们 
到 const， 所 以 cpp 本 号 不 是 一 个 和 常量， 而 〈*cpp)〉 做 了 一 次 间接 操作 之 
后 ， 跳 过 最 右边 的 * 号 ， 其 类 型 为 int const*。 很 显然 ， 这 个 类 型 的 最 右 
边 也 是 一 个 * 号 而 不 存在 const， 所 以 〈*cpp) 也 不 是 一 个 常量 ;最 后 再 
看 (**cpp) ， 做 了 第 二 次 间接 引用 之 后 ， 其 类 型 为 int const， 这 里 很 明 
显 就 有 一 个 const， 所 以 (**cpp) 是 一 个 常量 。 而 cqq 也 同样 分 析 ， 





的 类 型 为 int*const*const， 它 前 面 束 有 一 个 const， 所 以 cqq 自 映 是 一 个 常 
量 ; 而 做 了 第 一 次 间接 操作 之 后 ，〈*cqq〉 的 类 型 为 int*const， 很 显然 
最 右边 是 一 个 const， 所 以 〈*cqq) 也 是 一 个 常量 ; 最 后 看 做 第 二 次 间接 
操作 之 后 ，(**cqq)〉 的 类 型 ， 它 是 int， 没 有 const 修 饰 ， 所 以 (**cgqgq) 








由 于 像 const 以 及 volatile 类 型 限定 符 在 C90 标 准 中 就 已 经 引入 了 ， 所 
以 对 于 类 型 的 限定 看 上 去 有 些 别 扭 。 但 这 种 表达 方式 也 是 相当 完备 的 ， 
能 适用 于 任何 类 型 组 合 ， 这 也 是 C 语 言 从 标准 化 开始 起 就 注定 要 贯彻 设 
计 为 一 门 简 洁 、 灵 活 且 强大 的 编程 语言 这 一 目标 。 

















12.2 volatile 限定 符 





volatile 在 英语 中 的 意思 是 “不 稳定 的 ”“ 易 变 的 ”“ 易 挥发 的 ”。C 
语言 用 volatile 限 定 符 修饰 一 个 对 象 时 ， 指 明 该 对 象 的 值 可 能 会 被 异步 修 
改 ， 这 暗示 了 编译 器 不 要 对 该 对 象 做 寄存 器 暂 存 优化 ， 在 读 写 它 的 时 候 
总 需要 显 式 地 从 它 的 存储 器 地 址 中 获取 值 。 一 般 而 言 ，C 语 言 实现 会 将 
一 个 函数 中 多 次 出 现 的 同一 对 象 的 值 尽 可 能 地 存放 在 寄存 器 中 ， 如 果 该 
对 象 的 内 容 可 以 存放 在 寄存 器 中 不 超过 一 个 寄存 器 所 能 容纳 的 字 市 
数 ) ， 且 寄存 器 数量 足够 。 毕 葛 ， 寄 存 器 访问 比 读 写 内 存 要 快 得 多 。 











volatile 一 般 用 于 多 个 线程 所 共享 的 资源 ， 包 括 用 于 数据 同步 的 锁 对 
象 。 另 外 ， 骨 入 式 系统 也 会 将 MMR (存储 器 映射 的 寄存 器 ) 地 址 类 型 
定义 为 指向 volatile 的 指针 类 型 。volatile 修 饰 对 象 时 所 摆 放 的 位 置 与 它 所 
起 的 修饰 效果 同 const 一 样 ， 这 里 不 再 更 述 。 此 外 ，volatile 可 以 与 const 
一 同 使 用 ， 尽 管 这 么 做 的 场合 不 多 ， 不 过 对 于 MMR 的 访问 来 说 倒 也 不 
错 
0xff800000 地 址 所 映射 的 外 设 寄存 器 中 获取 int 类 型 的 相关 数据 。 这 里 使 
用 volatile 限 定 符 表 示 在 每 次 出 现 * (const volatile int* ) 0xff800000UL 
时 ， 都 要 显 式 地 读 取 该 地 址 中 的 内 容 ， 而 不 是 在 第 一 次 读 取 之 后 就 默认 
将 该 值 存放 在 CPU 的 寄存 器 中 ， 然 后 后 续 的 读 取 都 直接 从 该 寄存 器 中 获 
取 数 据 。 


比如 : int data=* (const volatile int* ) 0xff800000UL; 表示 从 














下 面 ， 我 们 将 通过 代码 清单 12-6 来 描述 volatile 限 定 符 的 使 用 以 及 效 


果 。 


代码 清单 12-6 ”volatile 的 使 用 及 效果 





#include <stdio.h> 
#include <pthread.h> 
































// 这 里 定义 了 一 个 Fun 函 数 ， 其 形 参 a 的 类 型 为 : int * const volatile 
static void Fun(int a[static volatile const 2]) 











printf("a[0] = %d，a[1] = %d\n", a[0], al[1]); 

















// 这 里 先 声 明 一 个 普通 的 int 类 型 静态 对 象 
static int normalInt ， 



































// 这 里 声明 了 一 个 volatile 的 jnt 类 型 静态 对 象 
static volatile int VolLatileInt ， 


// 这 个 函数 用 于 用 户 线程 执行 例 程 


static void* ThreadProc(void *param) 
























































{ 
// 这 里 的 考察 很 简单 ， 做 一 个 1000000 次 循环 ， 
// 每 次 分 别 将 normalInt 与 volatileInt 递 增 ， 
// 最 后 看 主线 程 中 这 两 个 值 的 变化 
for(int i = 0; i < 1000000; i++) 
{ 
normalInt++， 
volatileInt++; 
} 
return NULL; 
} 
int main(int argc, const char* argv[]) 
{ 














// 在 主线 程 中 ， 始 将 normalInt 与 volatileInt 初 始 化 为 9 
normalInt = 0; 
volatileInt = 0; 











pthread_ t threadID; 

// 我 们 用 pthread API 创 建 一 个 用 户 线程 ， 

// 该 线程 中 normalInt 与 volatileInt 在 不 断 变 化 
pthread_create(&threadID, NULL, &ThreadProc, NULL); 

































































// 我 们 这 里 就 循环 10999 次 ， 明 显 少 于 用 户 线程 的 1099900 次 ， 





























// 这 样 ， 用 户 线程 在 对 这 两 个 考察 对 象 的 最 终 修改 不 会 做 综合 (synthesize) 


while(volatileInt < 10000); 


// 我 们 在 Release 模 式 下 能 观察 到 ，normalInt 对 象 的 f 
// 而 volatileInt 则 得 到 了 当前 修改 后 的 值 
printf("normalInt = %d\n", normalInt); 
printf("volatileInt = %d\n", volatileInt); 











始终 为 0; 








II 























// 这 里 声明 一 个 指针 对 象 p，(*p ) 的 类 型 为 volatile int 
volatile int *p = &volatileIint,; 




















// 这 里 声明 指针 对 象 9， 它 自身 是 volatile 的 。 
// 人 人 不 是 volatile 的 
int * volatile q = &normalIint,; 


Fun((int[]){ *p, *q }); 








各 位 在 运行 代码 清单 12-6 中 的 代码 示例 时 必须 注意 ， 一 定 要 将 当前 
编译 环境 设置 为 Release 模 式 《〈 一 般 开 发 环境 默认 的 设置 是 Debug 模 
式 ) ， 只 有 这 样 ， 编 译 器 才 会 对 代码 做 出 优化 ， 我 们 才能 看 到 效果 。 而 
如 果 用 命令 行 编译 的 话 ， 我 们 可 以 直接 用 -O02 命令 选项 ， 并 日 不 添加 -g 
命令 选项 即 可 。 男 外 ， 在 Linux 环 境 下， 我 们 需要 使 用 --pthread 连 接 命 令 
选项 来 连接 pthread 的 安全 实现 运行 时 库 。 而 在 macOS 环 境 下 默认 已 经 把 
底层 的 库 都 连接 好 了 ， 无 需 手工 设置 。 














12.3 ”restrict 限 定 符 


restrict 限 定 答 是 从 C99 标 准 开 始 引 入 的 。 它 的 用 法 与 之 前 的 const 和 
volatile 有 所 不 同 ， 它 只 能 用 于 修饰 一 个 指针 类 型 的 对 象 ， 而 不 能 用 于 修 
饰 一 个 普通 对 象 。 通 过 受 restrict 限 定 的 一 个 指针 所 访问 的 一 个 对 象 与 该 
指针 具有 一 种 特殊 的 关联 性 。 这 种 关联 性 要 求 ， 对 该 对 象 的 所 有 访问 部 
要 直接 或 间接 使 用 那个 特定 指针 的 值 ， 而 不 受 其 他 指针 的 干涉 。 使 用 
restrict 限 定 符 可 暗示 编译 器 对 通过 指针 访问 的 数据 进行 优化 ， 比 如 说 我 
们 可 以 直接 将 受 restrict 限 定 的 指针 所 读 取 到 的 值 存放 在 寄存 占 中 ， 后 续 
再 次 出 现 对 该 指针 的 访问 时 可 直接 拿 寄 存 器 中 的 数据 ， 而 不 需要 做 真正 
的 访 存 操作 。 














下 面 我 们 通过 代码 清单 12-7 举 一 个 简单 的 示例 ， 这 样 大 家 就 能 有 一 
定 的 感性 认识 了 。 


代码 清单 12-7 初 筑 restrict 限 定 符 





#include <stdio.h> 
#include <stdint.h> 


int main(int argc, const char* argv[]) 


// 这 里 声明 一 个 数组 ， 它 含有 8 个 uint8_t 类 型 的 元 素 
uint8_t bytes[] = { Ox10, Ox20, Ox30, Ox40, 
Ox50, Ox60, QOx70, QOx80 }; 


// 声明 一 个 指向 jnt32_t 类 型 的 指针 对 象 p， 它 直接 指向 bytes 数 组 的 首 地 址 
int32 t *p = (int32_t*)bytes; 

// *p 的 初始 值 为 0x40302010 

printf("First, *p = Ox%.8X\n", *p); 















































// 声明 一 个 指向 int32_t 类 型 的 指针 对 象 9， 它 直接 指向 bytes[2] 位 置 元 素 的 地 址 








Int32 t *q = (int32 _t*)&bytes[2]; 
// *d 的 初始 值 为 9x69504030 
printf("First, *q = Ox%.8X\n", *q); 











*q += 16; 





// 输出 : *p = 0x40402010 
printf("Now, *p = Ox%.8X\n", *p); 





各 位 注意 ， 代 码 清单 12-7 中 的 示例 代码 必须 在 x86 处 理 器 或 ARMYV7 
或 更 高 版 本 的 处 理 器 中 执行 。 各 位 可 以 看 到 ， 代 码 清单 12-7 中 ， 指 针对 
象 p 与 指针 对 象 Q 之 间 是 有 有 登 加 部 分 的 ， 即 bytes[2] 与 bytes[3] 部 分 ， 这 两 
个 元 素 所 在 的 地 址 分 别 作为 p 所 指 对 象 的 高 2 字 布 以 及 q 所 指 对 象 的 低 2 字 
节 。 这 意味 独 无 论 是 指针 对 象 p 还 是 指针 对 象 9， 它 们 都 不 能 作为 一 个 指 
向 独立 对 象 的 指针 ， 也 就 是 说 ， (*p) 与 (*q) 所 表示 的 对 象 不 是 相互 
独立 的 ， 而 是 有 锥 交 (aliasing) 的 。 在 这 种 情况 下 ， 指 针 p 与 指针 q 都 不 
能 用 restrict 限 定 符 去 修饰 。 








很 显然 ， 如 果 我 们 这 里 允许 对 (*p) 与 (*q) 的 访问 做 寄存 器 暂 存 
优化 ， 那 么 当 对 〈(*p〉 做 修改 时 ，“*q) 的 低 2 字 节 也 被 改变 ， 而 寄存 
器 中 的 内 容 却 得 不 到 更 新 ， 同 样 ， 如 果 对 (*q) 做 修改 ， 那 么 (*p) 的 
高 2 字 节 的 值 也 被 修改 ， 而 其 寄存 器 中 的 内 容 也 得 不 到 更 新 ， 这 会 导致 
不 可 预期 的 结果 。 这 也 是 为 何 无 法 对 存储 空间 存在 合 交 的 两 个 指针 对 象 
做 restrict 限 定 的 原因 。 














对 于 一 个 受 restrict 限 定 符 限定 的 指针 对 象 ， 它 所 指向 的 存储 空间 应 
该 在 当前 执行 环境 下 是 唯一 的 ， 没 有 其 他 指针 与 它 指向 同一 个 存储 空 





间 ， 并 且 也 不 存在 任何 与 其 他 指针 所 指 回 的 存储 空间 有 重 登 的 情况 。 代 
码 清单 12-8 进 一 步 描 述 了 restrict 限 定 符 的 使 用 。 


代码 清单 12-8 restrict 限 定 符 的 进一步 使 用 





#include <stdio.h> 
#include <stdint.h> 























// 这 里 参数 a 的 类 型 为 : int * const volatile restrict 
static void Fun(int a[static const volatile restrict 2]) 


printf("The result is: %d\n", a[90] + a[1]); 


A 

* 下 面 我 们 自制 一 条 利用 restrict 限 定 符 的 存储 数据 拷贝 函数 

* @param pDst 指向 目的 存储 空间 

* @param pSrc 指向 源 存储 空间 

* @param count 指定 要 拷贝 多 少 个 int32_t 的 数据 元 素 

*/ 

void MyfastMemCpy(int32 t* restrict pDst, const int32 t* restrict pSrc, 
size_t count) 

























































































{ 
// 如 果 元 素 个 数 为 偶数 ， 我 们 直接 2 个 元 素 2 个 元 素 进 行 拷贝 ， 以 提升 效率 
if((count & 1) == 0) 
{ 
const size _t nLoop = count / 2; 
Uint64 _t* restrict p = (uint64 _t*)pDSst ， 
const uint64 t* restrict q = (const uint64 t*)pSrc; 
for(size t i = 0; i < nLoop; i++) 
p[li] = q[i]l; 
else 
for(size t i = 0; i < count; i++) 
pDst[i] = pSrc[i]; 
} 


int main(int argc, const char* argv[]) 


// 声明 了 两 个 int 类 型 对 象 a 和 b 
int a = 10, b = 20; 


// 声明 了 一 个 指向 int 类 型 的 受 restrict 限 定 的 指针 对 象 p， 
// 用 对 象 a 的 地 址 对 它 初始 化 
int* restrict p = &a; 


// 声明 了 一 个 指向 Int 类 型 的 受 restrict 限 定 的 指针 对 象 q， 
// 用 对 象 b 的 地 址 对 它 初始 化 
int* restrict q = &b; 


// 以 下 这 条 语句 是 非法 的 ! 两 个 restrict 限 定 的 指针 不 能 指向 同一 个 存储 空间 。 
// 尽管 编译 器 对 此 不 会 有 任何 警告 但 可 能 会 引发 未 定义 的 结果 
p= a qs 
















































































Fun( (int[]){*p, *q}); 


// 以 下 这 条 语句 是 非法 的 ， restrict 不 能 用 于 修饰 非 指针 类 型 
restrict int x = 0; 


// pe t ) 类 型 为 nt， 不 是 指针 类 型 
restrict int *t = 


// 下 面 定 义 了 两 个 数组 ， mss 
int32_t dst[1024] = {0 }; 
int32_t src[1024]; 


// 对 src 数 组 元 素 做 初始 化 
for(int i = 0; i < 1024; I++) 
src[i] = i; 


// 调用 我 们 自制 的 高 效 存储 器 拷贝 函数 
MyfastMemCpy(dst, src, 1024); 


// 最 后 我 们 验证 一 下 结果 
for(int i = 0; i < 1024; i++) 






































if(src[i] != dst[i]) 
{ 


puts("Result not equal!"); 
return -1; 
} 
} 


puts("Result equal!"); 





从 代码 清单 12-8 中 可 知 ， 对 restrict 限 定 的 指针 的 使 用 有 其 随意 性 ， 
我 们 在 写 代 码 的 时 候 如 果 无 意 间 破坏 了 restrict 的 要 求 ， 编 译 器 也 无 法 识 
别 ， 因 为 要 实现 这 种 识别 对 编译 器 来 说 开销 会 比较 大 。 所 以 restrict 关 键 

一 般 用 于 函数 形 参 ,提示 函 数 使 用 者 所 传 入 的 对 象 地 址 要 确保 其 唯一 
性 。 我 们 在 满足 restrict 要 求 的 时 候 ， 我 们 可 以 提供 更 高 效 的 运行 时 库 ， 
比如 像 代 码 清 单 12-8 中 的 MyFastMemCpy 函 数 。 当 我 们 确保 pDst 与 pSrc 
这 两 个 指针 所 指 辣 的 存储 空间 相互 独立 且 不 车 交 时 ， 我 们 可 以 采取 各 种 
优化 措施 ， 比 如 可 以 多 个 元 素 多 个 元 素 一 起 拷贝 ， 只 要 CPU 有 这 种 能 
力 。 但 是 ， 倘 知 我 们 传 入 的 指针 所 指向 的 存储 空间 不 能 满足 唯一 性 ， 或 
者 说 当中 有 装 交 ， 那 就 别 说 多 个 元 素 一 起 找 贝 了， 即便 连 指针 所 指向 对 











象 类 型 的 粒度 〈 这 里 是 int32_t 类 型 ) 进行 拷贝 都 无 法 确保 数据 正确 性 
(比如 代码 清单 12-7 所 呈现 的 情况 ) ， 只 能 一 个 字 节 一 个 字 节 进行 找 


由 5 


12.4 _Atomic 限 定 符 





_Atomic 限 定 符 是 在 最 新 的 C11 标 准 中 所 引入 的 。 所 以 它 限定 类 型 的 
方式 比 起 const、volatile 以 及 restrict 有 所 不 同 ， 它 直接 用 _Atomic( 类 型 
名 ) 这 种 方式 作为 原子 类 型 说 明 符 。 为 何 _Atomic 能 使 用 这 种 形式 作为 
类 型 限定 符 呢 ?因为 _Atomic 一 般 修饰 的 是 非 指 针对 象 类 型 ， 所 以 不 罕 
涉 限 定 指 向 数组 的 指针 以 及 指 癌 函数 的 指针 这 些 比 较 特 殊 的 类 型 表达 形 
起， 


如 果 将 一 个 对 象 声 明 为 原子 类 型 ， 那 么 说 明 该 对 象 是 原子 的 ， 这 也 
称 为 "原子 对 象 "。 原 子 对 象 的 访问 与 非 原子 的 有 所 不 同 ， 对 一 个 原子 对 
象 的 读 和 写 都 是 不 可 被 打 断 的 ， 此 外 有 很 多 针对 原子 对 象 的 修改 操作 
《比如 加 减 算术 计算 以 及 各 种 逻辑 计算 等 原子 操作 ) ， 这 些 原 子 操作 也 
古 不 可 被 打 断 的 。 一 个 操作 不 可 被 打 断 意味 着 在 执行 整个 操作 过 程 中 ， 
即便 有 一 个 硬件 中 断 信 号 过 来 ， 该 中 断 信 号 也 不 能 立即 触发 处 理 圳 的 中 
晰 执行 例 程 ， 处 理 器 必须 执行 完整 条 原子 操作 之 后 才 可 进入 中 断 执行 例 
程 。 对 于 中 断 控 制 器 而 言 往往 会 有 “未 决 ”〈Pending) 这 个 状态 ， 说 明 当 
前 中 断 尚 未 被 处 理 。 我 们 在 使 用 原子 操作 的 时 候 不 用 担心 当前 的 执行 线 
程 会 被 切换 ， 因 为 中 断 处 理 都 不 会 发 生 。 原 子 对 象 往往 用 于 多 核 多 线程 
并 行 计算 中 对 多 个 线程 共享 变量 的 计算 。 








原子 操作 的 另 一 大 特点 是 ， 对 于 来 目 多 个 处 理 需 核心 对 同一 个 存储 
空间 的 访问 ， 存 储 器 控制 器 会 去 仲裁 当前 哪个 原子 操作 先进 行 访 存 操 
作 ， 哪 个 后 进行 ， 这 些 访 存 操作 都 会 被 串 行 化 ， 所 以 这 对 于 多 核 多 线程 
并 行 计算 的 数据 同步 而 言 是 必需 的 处 理 喜 特征 。 我 们 无 法 通过 简单 的 开 
天 中断 去 控制 各 个 核心 同时 执行 不 同 线程 的 行为 与 状态 ， 所 以 在 多 核心 
多 线程 并 行 计算 的 环境 下 ， 原 子 操作 古 唯一 的 数据 同步 手段 。 为 外 在 此 
环境 下 ， 像 互 斥 体 mutex) 、 信 号 量 (semaphore) 等 同步 原 语 的 实现 
也 都 基于 原子 操作 。 








我 们 在 C11 标 准 下 的 C 语 言 中 使 用 原子 操作 时 ， 应 当 包 含 
<stdatomic.h> 标 准 库 头 文件 ， 该 头 文件 中 已 经 预定 义 了 一 些 当前 主流 处 
理 器 所 能 支持 的 原子 对 象 类 型 ， 此 外 还 有 相应 的 原子 操作 函数 。 我 们 在 
实际 使 用 原子 类 型 时 应 当 避 免 直接 使 用 _Atomic《〈 类 型 名 ) 这 种 形式 ， 
而 是 直接 用 <stdatomic.h> 头 文件 中 已 经 定义 好 的 原子 类 型 。 当 前 C11 标 
准 中 所 罗列 的 能 够 支持 原子 对 象 类 型 的 基本 类 型 均 为 整数 类 型 ， 也 就 是 
说 除 整 数 类 型 外 的 其 他 类 型 都 无 法 作为 原子 对 象 类 型 (包括 浮 点 类 
型 ) 。 我 们 常用 的 原子 对 象 类 型 有 : atomic_bool、atomic_char、 


atomic_ schar、 atomic uchar、atomic ushort、atomic short、atomic_int、 





atomic uint、atomic long、atomic ulong、atomic_char16 _t、 

atomic char32_t、atomic_wchar t、atomic_intptr_t、atomic_uintptr_t、 
atomic_size t、atomic_ptrdiff t 等 。 像 这 里 面 atomic_int 类 型 就 被 定义 为 
_Atomic (Cint) ， 而 像 atomic_size _t 类 型 就 被 定义 为 _Atomic (size_ t) 。 


此 外 ， 原 子 对 象 的 初始 化 与 普通 对 象 也 有 所 不 同 ， 在 <stdatomic.h> 
头 文件 中 定义 了 两 个 接口 ， 分 别 用 于 对 全 局 原子 对 象 与 函数 内 局 部 原子 
对 象 进行 初始 化 。 男 外 ， 对 原子 对 象 的 读 写 也 不 应 该 直接 用 = 赋值 操作 

而 是 需要 通过 使 用 atomic_load 函 数 进 行 读 ，atomic_store 函 数 进 行 
写 。 代 码 清单 12-9 将 先 简单 介绍 原子 对 象 的 一 些 基 本 操作 。 





代码 清单 12-9 ”原子 对 象 的 初步 使 用 





#include <stdio.h> 
#include <stdatomic.h> 


// 这 里 声明 了 一 个 int 类 型 的 静态 原子 对 象 SIntAtom 
// 我 们 通过 ATOMIC_VAR INIT 宏 函数 对 其 初始 化 为 100 
static atomic_int SIntAtom = ATOMIC_VAR_INIT(100); 





















































int main(int argc, const char* argv[]) 


// 这 里 在 main 函 数 中 声明 了 局 部 原子 对 象 a 


atomic_int a; 


// 我 们 通过 atomic_init 函 数 对 原子 对 象 a 进 行 初始 化 为 10 
atomic_init(&a, 10); 


// 我 们 通过 atomic_store 函 数 将 原子 对 象 a 修 改 为 20 


atomic_store(&a, 20); 


// 我 们 通过 atomic_load 函 数 将 原子 对 象 a 的 值 加 载 到 普通 对 象 b 中 


int b = atomic_ load(&a); 


// 我 们 利用 atomic _fetch_add 函 数 ， 对 原子 对 象 SIntAtom 与 普通 对 象 b 做 原子 加 法 操作 。 
// 此 时 返回 的 结果 是 做 原子 加 法 操作 之 前 的 SIntAtom 的 值 
int oldValue = atomic fetch add(&sIntAtom, b); 
























































































































































printf("oldValue = %d\n", oldValue); 


// 我 们 将 原子 加 法 操作 之 后 的 SIntAtom 原 子 对 象 的 值 ， 加 载 到 对 象 b 中 
b = atomic_ load(&sIntAtom); 








printf("sIntAtom = %d\n", b); 





代码 清单 12-9 清 晰 而 又 精简 地 介绍 了 对 原子 对 象 的 各 类 操作 。 这 里 
给 大 家 呈现 的 是 对 原子 对 象 的 初始 化 、 加 载 、 存 储 以 及 原子 加 法 操作 。 





除了 原子 加 法 操作 之 外 ，C11 标 准 还 定义 了 以 下 原子 算术 逻辑 操作 : 
atomic_fetch_sub (原子 减法 操作 ) 、atomic_fetch_or (原子 按 位 或 操 
作 ) 、atomic_fetch_xor (原子 按 位 异 或 操作 ) 、atomic _fetch_and ( 原 
子 按 位 与 操作 ) 。 这 里 要 注意 的 是 ， 这 些 算术 逻辑 原子 操作 都 不 能 用 于 
atomic_bool 类 型 ， 即 布尔 原子 类 型 。 另 外 这 里 需要 注意 的 是 ， 对 原子 对 
象 的 初始 化 函数 本 身 并 非 原 子 的 ， 也 就 是 说 ，atomic_init 函 数 是 可 被 打 
晰 的 。 因 此 我 们 在 对 原子 对 象 做 初始 化 时 应 当 统一 在 一 个 线程 中 完成 
《通常 是 主线 程 ) ， 然 后 再 做 线程 分 派 调度 。 另 外 ， 我 们 不 应 该 使 用 
atomic_store 原 子 存储 操作 对 原子 对 象 进行 初始 化 ， 对 原子 对 象 的 初始 化 
操作 只 有 ATOMIC_VAR_INIT 与 atomic_init 这 两 个 接口 。 同 时 ， 其 他 原 
子 操作 必须 作用 于 已 初始 化 的 原子 对 象 ， 否 则 结果 可 能 是 未 知 的 。 











代码 清单 12-10 将 给 大 家 带 来 一 个 比较 实用 的 例子 来 描述 原子 对 象 
以 及 原子 操作 的 使 用 与 效果 。 在 这 个 例子 中 ， 我 们 将 定义 一 个 
10000x100 的 一 个 int 类 型 的 二 维 数 组 ， 并 对 它 的 所 有 元 素 进行 求 和 操 
作 。 我 们 将 使 用 双核 双 线 程 并 行 计算 来 达成 这 个 目的 。 


代码 清单 12-10 ”双核 双 线 程 对 二 维 数 组 求 和 





#include <stdio.h> 
#include <stdatomic.h> 
#include <stdbool.h> 
#include <stdint.h> 
#include <pthread.h> 





// 声明 一 个 静态 unsigned long long 类 型 的 原子 对 象 ， 初 始 化 为 0， 
// 用 于 存放 原子 计算 操作 的 求 和 计算 结果 
static volatile atomic ullong sAtomResult = ATOMIC_ VAR_INIT(0); 


// 声明 一 个 静态 的 jnt 类 型 的 原子 对 象 ， 初 始 化 为 9， 









































// 用 于 存放 原子 计算 操作 的 当前 计算 数组 的 行 索引 
static volatile atomic_int SAtomIndex = ATOMIC_VAR_INIT(0) 














// 声明 一 个 静态 普通 的 uint64_t 类 型 对 象 ， 并 将 它 初始 化 为 0， 
// 用 于 存放 普通 计算 操作 的 求 和 计算 结果 


static volatile uint64 t sNormalResult = 0; 


// 声明 一 个 静态 普通 的 jnt 类 型 对 象 ， 并 将 它 初始 化 为 9， 
// 用 于 存放 普通 计算 操作 中 当前 计算 数组 的 行 索引 


static volatile int SNormalIndex = 0; 


// 由 于 这 个 标志 在 用 户 线程 中 只 写 ， 且 在 主线 程 中 只 读 ， 
// 因此 在 这 两 者 线程 中 并 不 会 产生 数据 竞争 ， 所 以 无 需 使 用 原子 对 象 


static volatile bool SISsThreadCompJlete = false,; 


// 声明 即将 用 于 计算 的 二 维 数组 
static int sArray[10000][100]; 


// 定义 普通 计算 操作 的 线程 例 程 


static void* NormalSumProc(void *param) 





















































































































































































































































































































































{ 
// 这 里 使 用 一 个 currIndex 对 象 ， 使 得 SNormalIndex 在 每 次 迭代 中 仅 被 读 取 一 次 ， 
// 减少 外 部 修改 的 干扰 
int currIindex; 
// 在 每 次 迭代 时 ， 先 读 取 当 前 行 索引 的 值 ， 然 后 立即 对 它 做 递增 操作 
while((currIindex = SNormalIndex++) < 10000 ) 
// 得 到 当前 行 索引 之 后 ， 对 当前 行 的 数组 做 求 和 计算 
Uint64 t sum = 0; 
for(int i = 0; i < 100; i++) 
sum += sArray[currIindex][i]; 
sNormalResult += sum; 
} 
// 用 户 线 程 计 算 结束 ， 将 sIsSThreadComplete 标 志 置 为 true 
sIsThreadComplete = true; 
return NULL; 
} 


// 定义 原子 操作 计算 的 线程 例 程 


static void* AtomSumProc(void *param) 


{ 
int currIindex; 
while((currIindex = atomic fetch add(&sAtomIndex, 1)) 
< 10000) 
{ 
uint64_t sum = 0; 
for(int i = 0; i < 100; i++) 
sum += sArray[currIindex][i]; 
atomic_ fetch add(&sAtomResult, sum); 
} 
sIsThreadComplete = true; 
return NULL; 
} 
int main(int argc, const char* argv[]) 
{ 

















// 我 们 先 对 sArray 数 组 进行 初始 化 
for(int i = 0; i < 10000; i++) 


for(int ] = 0; j < 100; j++) 
SArray[I][j] = 100 * i + j; 
} 


// 我 们 先 在 主线 程 中 计算 出 标准 正确 的 计算 结果 
Uint64 t standardResult = 0; 



































for(int i = 0; i < 10000; i++) 
for(int j] = 0; j < 100; j++) 
standardResult += sArray[i][j]; 
} 


printf("The standard result is: %llu\n", standardResult); 


// 下 面 我 们 先 观察 不 用 原子 对 象 与 原子 操作 的 计算 
pthread t threadID 




















pthread_create(&threadID，NULL，&NormalSumProc，NULL) ， 


// 在 主线 程 中 也 做 类 似 的 计算 处 理 


int currIndex' 


// 使 用 原子 加 法 操作 对 当前 原子 数组 行 索引 做 后 绥 递 增 操作 


while((currIindex = SNormalIndex++) < 10000 ) 




















Uint64 t sum = 0; 
for(int i = 0; i < 100; i++) 
sum += sArray[currIindex][i]; 


sNormalResult += sum; 


} 


// 等 待 用 户 线程 完成 
while(!sIsThreadComplete); 























if(sNormalResult == standardResult) 
puts("Normal compute compared equal!"); 
else 


printf("Normal compute compared not equal: %llu\n", 
sNormalResult); 


} 


// 我 们 最 后 对 原子 操作 的 线程 做 并 行 计算 
sIsThreadComplete = false; 


pthread_create(&threadID, NULL, &AtomSumProc, NULL); 


while((currIindex = atomic_ fetch add(&sAtomIndex, 1)) 
< 10000) 


Uint64 t sum = 0; 
for(int i = 0; i < 100; i++) 
sum += sArray[currIindex][i]; 


atomic_ fetch add(&sAtomResult, sum); 


} 


// 等 待 用 户 线程 完成 
while(!sIsThreadComplete); 























if(atomic_ load(&sAtomResult) == standardResult) 
puts("Atom compute compared equal!"); 
else 


puts("Atom compute compared not equal!"); 





代码 清单 12-10 不 仅 有 原子 操作 的 求 和 计算 ， 而 且 还 有 不 采用 原子 
操作 的 求 和 计算 。 我 们 可 以 实际 操作 一 下 ， 能 观察 到 若 采 用 普通 求 和 计 
算 往往 无 法 得 到 正确 的 计算 结果 ， 且 计算 结果 的 值 每 次 执行 还 都 不 一 
样 。 这 就 是 因为 像 ++ 操 作 、+ 操 作 的 非 原 子 性 造成 的 。 像 这 类 修改 操作 
其 实 有 三 个 步骤 : 读 取 数 据 、 修 改 数据 、 存 储 数据 。 比 如 像 at+;， 这 个 
操作 ， 如 果 用 处理 器 指令 来 表示 的 话 人 至 少 需 要 三 条 指令 
[a]〈 将 对 象 的 值 加 载 到 reg 寄 存 器 中 ) ; inc reg (对 reg 寄 存 器 做 递增 操 
作 ) ; store reg，[al]〈 将 reg 寄 存 器 的 值 再 写 回 对 象 a 中 ) 。 对 于 原子 加 
法 操作 而 言 ， 它 们 将 被 组 合成 一 单条 指令 ， 并 且 整 个 操作 过 程 不 能 被 打 
呆 。 而 对 于 普通 操作 ， 这 三 条 指令 每 条 执行 完 之 后 都 能 被 打 断 ， 这 就 使 
得 一 个 线程 对 寄存 器 做 了 修改 之 后 ， 但 在 写 回 之 前 被 其 他 线程 先 写 回 
了 ， 然 后 等 该 线程 再 写 回 就 把 先前 线程 修改 的 内 容 给 覆盖 了 ， 从 而 造成 
了 数据 的 不 一 致 性 。 关 于 这 个 时 序 问题 我 们 可 以 通过 图 12-1 来 清晰 看 
到 。 











load reg， 














图 12-1 中 上 半 部 分 是 非 原子 的 修改 操作 ， 下 半 部 分 是 原子 的 修改 操 
作 。 我 们 可 以 清晰 地 观察 到 对 于 非 原 子 的 读 一 修改 一 写 操 作 之 间 存 在 着 
间 隐 ， 这 些 间 陀 都 会 被 CPU 利用 ， 一 旦 有 中 断 信 号 过 来 就 会 被 打 断 ， 或 
者 被 其 他 处 理 器 核心 的 相关 操作 给 缆 盖 。 像 图 12-1 中 ， 线 程 A 与 线程 B 
几乎 同时 对 一 个 共 孕 存储 单元 读 取 值 ， 然 而 线程 A 操 作 比 较 快 ， 移 写 回 











数据 ， 而 线程 B 操 作 稍 慢 后 写 回 ， 但 是 等 到 线程 B 与 回 数据 的 时 候 就 直 
接 把 线程 A 已 修改 好 的 数据 给 完全 徐 盖 了 ! 换 句 话说 ,线程 B 并 没有 基 
于 线程 A 先 修改 好 的 数据 做 相应 操作 。 而 原子 操作 则 不 一 样 ， 它 们 古 作 
为 一 个 整体 的 操作 ， 如 果 同 时 有 两 个 原子 操作 对 同一 共 至 存储 单元 进行 
操作 ， 那 么 存储 器 控制 希 会 做 仲裁 哪个 操作 优先 、 哪 个 操作 断后 ， 并 且 
稍 后 执行 的 原子 操作 必定 基于 之 前 修改 完 的 结果 进行 。 因 为 一 个 原子 操 
作 在 被 允许 操作 之 前 ， 连 读 取 操 作 都 不 会 执行 ， 而 当 存 储 器 控制 右 允 许 
某 个 原子 操作 执行 时 ， 那 么 读 取 一 修改 一 写 回 这 三 个 操作 才 会 捆绑 着 执 














行 。 
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图 12-1 原子 操作 与 非 原子 操作 的 顺 厅 图 


Os 当前 Visual Studio Community 2017 中 的 VS-Clang 对 原子 
操作 的 编译 器 后 端 还 没 文 持 好 ， 所 以 各 位 如 果 要 在 Windows 系 统 上 测试 
代码 清单 12-9 与 代码 清单 12-10 中 的 内 容 的 话 ， 请 使 用 基于 GCC 的 Mingw 
或 纯 Clang 编 译 器 。 或 参考 GitHub 上 的 代码 : https://github.com/zenny- 








chen/simple-stdatomic-for-VS-Clang。 这 里 提供 了 基于 VS-Clang 环 境 中 内 
建 函 数 对 部 分 原子 操作 的 实现 。 各 位 将 此 GitHub 中 的 stdatomic.h 以 及 
stdatomic.c 放 到 上 自己 的 工程 项 目 中 ， 然 后 用 #include.“stdatomic.h” 进 行 


办 
> 


原子 操作 其 实 属于 一 个 比较 大 的 问题 领域 ， 这 里 仅仅 揭露 了 其 冰山 
一 角 。C11 标 准 对 于 原子 库 还 有 相关 的 存储 器 次 序 这 个 概念 ， 此 外 还 有 
lock-free《〈 无 锁 ) 同步 算法 所 需 的 原子 操作 ， 这 些 更 高 级 的 话题 我 们 将 
放 到 本 书 姊 妹 篇 标准 库 卷 做 详细 描述 。 





12.5 本章 小 结 


本 章 内 容 属于 C 语 言 中 比较 高 端的 话题 ， 也 是 比较 临 泌 难民 的 部 

。 如 果 大 家 对 本 章 所 讲述 的 类 型 限定 符 掌握 到 驾驭 自如 的 境界 的 话 ， 
那么 离 C 语 言 大 师 也 就 不 远 了 。 对 于 本 章 ， 笔 者 认为 对 于 大 部 分 初学 者 
来 说 光 看 一 过 还 远 远 不 够 ,大 家 需要 不 断 实践 ， 然 后 再 去 巩固 阅读 ， 相 
信 每 次 阅读 都 会 有 新 的 收获 。 





最 后 ， 在 12.4 节 中 提 到 _Atomic 所 使 用 的 _Atomic《〈 类 型 名 ) 这 种 表 
达 方 式 ， 如 果 我 们 在 使 用 const、volatile 以 及 restrict 时 ， 在 不 涉及 指向 数 
组 的 指针 与 指向 函数 的 指针 这 些 表 达 方式 的 情况 下 也 可 以 这 么 玩 ， 代 码 
清单 12-11 将 给 大 家 呈现 这 种 奇妙 的 表达 方式 。 


代码 清单 12-11 有 趣 的 类 型 限定 符 表 达 方 式 





#include <stdio.h> 




















// 我 们 自己 定义 一 个 类 似 于 _Atomic 用 法 的 宏 CONST 
#define CONST(type) type const 




















int main(int argc, const char* argv[]) 


// 声明 一 个 int 类 型 的 常量 对 象 a， 并 初始 化 为 10 
CONST(int) a = 10; 




















int b = 0; 


// 声明 一 个 普通 指针 对 象 ， 指 向 a 的 地 址 
// (*p) 的 类 型 为 const int 
CONST(int) *p = &a; 


// 声明 一 个 常量 指针 对 象 9， 指 向 对 象 b 的 地 址 
// qd 的 类 型 为 Int * const 

CONST(int*) q = &b， 

*q 十 二 20 


// 声明 一 个 指针 对 象 pp， 指 向 指针 p 的 地 址 














// 其 类 型 为 const int * const * 

CONST(CONST(int)*) *pp = &p; 

printf("The value is: %d\n", **pp + *q); 
} 





对 于 代码 清单 12-11 我 们 可 以 看 到 ， 只 有 在 CONST 圆 括号 里 包围 的 
类 型 才 是 常量 类 型 。 像 指针 对 象 p，CONST 所 包围 的 是 int 类 型 ， 所 以 指 
针 p 本 身 不 是 常量 ， 而 (*p) 才 是 。 而 指针 对 象 g 则 相反 ，CONST 包 围 
的 是 intt， 所 以 指针 对 象 本 身 是 常量 ,但 (*q) 则 不 是 。 而 对 于 比较 复 
杂 的 pp 对 象 ， 最 外 围 的 CONST 包 围 的 是 CONST (int) * 类 型 ， 所 以 pp 自 
身 不 是 一 个 常量 ; 但 (*pp) 就 是 了 ， 它 的 类 型 就 是 
CONST (CONST (int) *) ; 而 (**pp) 的 类 型 则 是 CONST (int) ， 


明显 也 是 个 常量 。 























所 以 ， 只 要 把 基本 的 概念 掌握 之 后 ， 我 们 可 以 目 己 抽象 出 一 套 解析 
方法 。 无 论 怎么 变 ， 万 变 不 离 其 宗 。 





第 13 章 ”C 语 言 的 类 型 系统 


类 型 系统 (type system) 在 许多 强 类 型 编程 语言 中 扮演 了 非常 重要 
的 角色 ， 比 如 C、C++、Java、Objective-C、Swift， 等 等 。 这 些 编程 语 
言 中 ， 不 同类 型 的 对 象 本 身 所 具有 的 含义 、 能 表示 的 值 的 范围 等 都 可 能 
有 所 不 同 。 我 们 在 前 几 章 中 已 经 详细 讲述 了 C 语 言 的 基本 类 型 、 用 户 自 
定义 类 型 、 指 针 、 数 组 等 ， 此 外 还 有 类 型 限定 符 。 这 些 类 型 、 类 别 与 限 
定 符 的 相互 组 合 能 构成 多 种 不 同 的 完整 类 型 ， 使 得 C 语 言 的 类 型 具有 丰 
富 多 样 性 ， 同 时 也 具有 灵活 性 与 统一 性 。C 语 言 的 类 型 系统 是 相当 完备 
的 ， 这 意味 着 我 们 通过 C 语 言 现 有 的 语法 特征 ， 无 论 怎 么 组 合 ， 都 能 构 
造 出 一 个 合法 的 类 型 来 。 




















本 章 将 给 大 家 总 结 并 更 深入 地 介绍 C 语 言 的 类 型 系统 ， 让 大 家 深刻 
体会 到 其 中 的 博大 精深 。 然 后 给 大 家 介绍 一 下 C11 标 准 中 对 类 型 的 各 种 
分 类 方法 。 最 后 一 小 节 将 引入 C 语 言 的 为 一 个 非常 有 用 的 语法 特征 一 一 


typedef， 可 以 将 任 一 类 型 抽象 为 一 个 类 型 标识 符 。 


13.1 对 象 类 型 与 函数 类 型 


C 语 言 的 对 象 类 型 由 三 大 部 分 组 成 一 一 类 型 说 明 符 (type 
specifier) 、 类 型 限定 符 (type qualifier) 、 对 象 类 别 (type 
category) 。 类 型 说 明 符 包 括 了 像 void、char、short、int 等 基本 类 型 ， 还 
有 结构 体 、 联 合体 说 明 符 ， 枚 举 说 明 符 ， 原 子 类 型 说 明 符 以 及 typedef 
名 。 类 型 限定 符 包 括 const、volatile 以 及 restrict( 这 里 已 经 把 _Atomic 限 
定 的 类 型 归 类 为 原子 类 型 说 明 符 ) 。 对 象 类 别 主要 就 是 数组 与 指针 类 


别 。 





而 函数 类 型 由 函数 的 返回 类 型 与 形 参 列表 组 成 。 其 中 ， 返 回 类 型 与 
形 参 列表 中 每 个 形 参 的 类 型 都 是 对 象 类 型 。 如 果 形 参 列表 为 空 ， 那 么 形 
参 列 表 可 用 void 声明 。 





我 们 在 判定 一 个 对 象 的 类 型 时 ， 首 先 应 该 先 判 定 当前 对 象 的 类 别 ， 
即 它 是 一 个 普通 对 象 还 是 一 个 数组 对 象 或 是 指针 对 象 。 对 象 类 别 是 互 斥 
的 ， 也 就 是 说 ， 如 果 一 个 对 象 是 普通 对 象 ， 那 么 它 就 不 可 能 再 是 指针 对 
象 或 数组 对 象 。 因 此 ， 一 个 对 象 的 类 别 只 能 是 普通 、 指 针 与 数组 中 的 一 
个 。 知 道 了 类 别 之 后 ， 我 们 就 可 以 再 判定 该 对 象 的 完整 类 型 ， 包 括 如 何 
被 限定 符 修 饰 等 等 。 代 码 清单 13-1 给 出 了 一 些 对 象 类 型 与 函数 类 型 的 例 
Te 





代码 清单 13-1 ”对象 类 型 与 函数 类 型 





#include <stdio.h> 















































// 这 里 声明 了 一 个 静态 全 局 数组 对 象 SArray， 其 类 型 为 jnt [3] 
// 它 具 有 3 个 ijnt 类 型 的 元 素 
static int SArray[3] = { 1, 2, 3 }; 














// 定义 了 Func1 函 数 ， 其 类 型 为 : Int* (int)， 
// 表示 函数 返回 类 型 为 nt*， 形 参 列表 中 含有 一 个 参数 ， 
static int* Funci(int a) 




















其 类 型 为 int 





printf("Funci a = %d\n", a); 
return sArray; 


} 
// 定义 了 Func2 函 数 ， 其 类 型 为 ;: 














int (* (int, floa 


1 r 
— 









































)[3]， 
lz 参 列 窒 具有 两 个 参数 ， 第 一 个 形 














// ts (*) [3]， 
// 第 二 个 形 参 f 具 有 float 类 型 
static rt (*Func2(int a, float f))[3] 















































printf("Func2 Sum = %f\n", a + f); 
return &sArray; 


int main(int argc, const char* argv[]) 

// 这 里 声明 了 一 个 指针 对 象 p， 其 类 型 为 const int * 
// 并 用 Func1 函 数 调 | 的 返回 值 为 它 初 始 化 

const int *p = Funci(3); 

printf("*p = %d\n", *p); 


// 这 里 声明 了 一 个 指针 对 象 pFunc， 它 指向 函数 Func2 
int (*(*pFunc)(int, float))[3] = &Func2; 
pFunc(3, 10.5f)[0][1]++; 




























































































// 声明 了 int 类 型 的 普通 对 象 elem 
int elem = sArray[1]; 
printf("elem = %d\n", elem); 











NR: 
BS 








int 类 型 











代码 清单 13-1 中 ， 静 态 全 局 对 象 sArray 的 类 田 
数 中 声明 的 对 象 p 与 pFunc 的 类 


象 。 这 里 也 清楚 地 描述 了 函数 的 返回 类 型 以 及 形 参 
象 类 型 来 表示 的 。 


代码 清单 13-1 中 的 Func2 函 


| 是 一 个 数组 ，main 霄 
别 都 是 指针 ， 而 对 象 elem 则 是 一 个 普通 对 
类 型 ， 它 们 都 是 用 对 


数 的 类 型 以 及 main 函 数 中 声明 的 pFunc 函 


数 指针 对 象 类 型 比较 复 洒 ， 我 们 将 在 13.3 节 中 详细 分 析 这 种 复杂 的 类 型 
声明 方式 以 及 对 其 类 型 的 剂 析 。 另 外 ， 本 节 大 致 介绍 了 对 象 与 函数 类 型 
的 构成 ， 这 将 作为 下 面 几 闻 的 基础 。 


13.2 ”对 声明 符 的 进一步 说 明 

为 了 能 让 各 位 更 深刻 地 理解 一 个 对 象 与 函数 的 类 型 ， 我 们 这 里 将 引 
入 比较 完整 的 C11 标 准 所 给 出 的 声明 文法 。 

declaration: 

declaration-specifier init-declarator-listopt; 

static_assert-declaration 

declaration-specifier: 

storage-class-specifier declaration-specifieron 

type-Specifier declaration-specifiero, 
type-qualifier declaration-specifieront 
function-specifier declaration-Sspecifieropt 
alignment-specifier declaration-Specifieront 


init-declarator-list: 


init-declarator 


init-declarator-list, init-declarator 
init-declarator: 
declarator 


declarator=initializer 
我 们 从 上 述 关 于 声明 的 文法 中 可 以 看 到 ，C 语 言 中 声明 包含 了 两 大 
部 分 : 一 个 是 声明 说 明 符 (declaration-specifier〉 ， 另 一 个 是 声明 符 
(declarator〉。 我 们 在 看 声明 符 之 前 可 以 尝试 代码 清单 13-2 中 这 些 奇怪 


但 又 符合 文法 的 写法 。 


代码 清单 13-2 ”无 声明 符 的 声明 





int main(int argc, const char* argv[]) 


static,; 
extern const int; 
_Alignas(8); 





代码 清单 13-2 中 列 出 的 三 个 声明 都 是 合法 有 效 的 声明 ， 尽 管 在 编译 
时 编译 器 会 报 出 “此 声明 没有 声明 任何 东西 ?之 类 的 警告 。 因 为 在 声明 的 
文法 中 也 明确 指出 ， 在 声明 说 明 符 中 后 面 的 初始 化 声明 符 列 表 可 省 ， 当 
然 最 后 的 分 号 是 必须 有 的 。 下 面 我 们 再 来 看 声明 符 的 文法 。 





declarator: 


pointer direct-declarator 


opt 
direct-declarator: 

identifier 

(declarator) 

direct-declarator [type-qualjifier-listopt assignment-expressionopt] 


direct-declarator [statictype-qualifier-list assignment-expression]| 


opt 
direct-declarator [type-qualjifier-listopt Static assignment-expression] 
direct-declarator [type-qualjifier-listoo * | 

direct-declarator © (parameter-type-list) 


) 


direct-declarator & (identifier-listo 


pointer: 


*type-dualifier-listont 


*type-dualifier-listuot pointer 


type-qualifier-list: 


type-qualifier 
type-qualifier-list type-qualifier 


我 们 这 里 可 以 看 到 ， 指 针 与 数组 类 别 都 是 在 声明 符 中 体现 出 来 的 。 
此 外 ， 无 论 在 上 述 的 声明 说 明 符 中 还 是 在 这 里 的 直接 说 明 符 (direct- 
declarator) 中 ， 我 们 都 看 到 了 类 型 限定 符 的 号 影 。 因 此 ， 我 们 也 可 以 将 
类 型 限定 符 看 作 既 可 以 修饰 类 型 ， 也 可 以 修饰 类 别 。 此 外 ， 我 们 在 数组 
里 也 可 以 看 到 其 中 能 够 包含 一 条 赋值 表达 式 。 这 个 在 之 前 描述 数组 的 
时 候 并 未 涉及 太 多 ， 由 于 确实 用 得 很 少 ， 并 且 这 也 是 自 C99 标 准 中 引入 
了 可 变 长 度数 组 之 后 才 引 入 的 语法 特性 。 代 码 清单 13-3 先 对 此 语法 特性 
进行 描述 。 











代码 清单 13-3 ”数组 声明 的 下 标 中 含有 赋值 表达 式 的 情况 





#include <stdio.h> 




















// 这 里 定义 了 静态 函数 Func1， 带 有 两 个 形 参 ， 形 参 a 是 Int 类 型 ; 
// 形 参 s 则 是 一 个 ijnt * const 类 型 ， 这 里 用 一 个 变 长 数组 来 表示 
static void Funci(int a, int s[static const a += 5]) 


// 注意 ， 这 里 形 参 s 中 动用 了 a += 
// 这 意味 着 当 函 数 Funci 被 调用 时 ， 背 参 a 的 信 会 动 加 5 
printf("Funci a = %d\n", a); 




























































































int main(int argc, const char* argv[]) 
int a = 1; 
Func1i(10, &a); 
// 这 里 声明 了 一 个 变 长 数组 对 象 S， 
// 在 数组 下 标 里 使 用 了 一 个 赋值 表达 式 ， 使 得 局 部 对 象 a 的 值 加 10 
int s[a += 10]; 


// s 数 组 具有 11 个 int 元 素 
printf("The size of s = %zu\n", sizeof(s) / sizeof(s[0])); 
























































// a 的 值 为 11 


printf("a = %d\n", a); 





代码 清单 13-3 描 述 了 声明 数组 对 象 时 ， 在 数组 下 标 里 使 用 赋值 表达 
式 的 情况 这 得 益 于 C 语 言 中 二 赋值 操作 符 与 十 二 等 复合 赋值 操作 符 直 接 
返回 它们 左 操作 数 的 值 的 语法 特性 。 当 然 ， 对 于 这 种 写法 不 建议 小 
因为 这 并 不 会 让 代码 看 上 去 有 多 简洁 ， 上 反而 容易 让 人 看 得 防 坚 。 这 里 引 
出 这 个 代码 示例 主要 是 针对 C11 标 准 中 给 出 声明 符 的 文法 而 言 的 ， 大 家 











看 到 了 文法 定义 ， 目 然 束 可 写 出 很 多 有 趣 的 《但 可 能 并 不 实用 的 ) 表达 
式 和 语句 。 


下 面 我 们 将 详细 谈 谈 直 接 声 明 符 中 第 二 个 文法 一 一 《declarator) 。 
这 种 形式 一 般 用 于 声明 指 疝 数组 的 指针 以 及 指向 函数 的 指针 对 象 。 不 过 
对 于 普通 对 象 ， 其 他 指针 对 象 以 及 数组 对 象 也 均 能 使 用 这 种 声明 符 表达 
方法 。 代 码 清单 13-4 将 给 出 使 用 例子 。 


代码 清单 13-4 。 (declarator〉 的 声明 方式 





#include <stdio.h> 
int main(int argc, const char* argv[]) 


// I 
int (a) = 0; 


// 声明 了 指向 const en 
const int (*p) = &a 


// 声明 了 指向 int 类 型 的 常量 指针 对 象 q 


int (* const q) = &a; 


// 声明 ] Wi 
int (b)[3] = { 1, 3 }; 

















> 









































// 三 个 int* 类 型 元 素 的 数组 对 象 c 
dnt* 1 = &a }; 











// 这 里 声明 个 指向 int[3] 数 组 的 党 量 指针 Fr 
int (* const r)[3] = &b; 


// 这 里 声明 了 包含 两 个 nt 类 型 元 素 的 数组 对 象 d 
int (d[2]) ={9j 


// 这 里 声明 了 包含 两 个 Int 类 型 元 素 的 数组 对 象 e 
int 《(e)[2]) = ={9 


// const int (*) 可 以 直接 作为 完整 类 型 进行 类 型 转换 ， 这 相当 于 const int * 
printf("a = %d\n", *(const int(*))p); 


// 同样 ，int((*) )[3] 也 可 直接 作为 完整 类 型 进行 类 型 转换 ， 
// 这 里 ((*) ) 与 (*) 的 作用 也 是 一 样 的 ， 相 当 于 int (*)[3] 
printf("b[9] = %d\n™, ((int((*))[3])r)[0][0]); 

































































































































































printf("Remain result: %d\n", *q + *c[0] + d[90] + el[1]); 





从 代码 清单 13-4 中 我 们 可 以 看 到 原本 为 指 癌 数组 的 指针 与 指 癌 函 数 
的 指针 而 设计 的 declarator) ， 由 于 在 实际 使 用 中 C 语 言 标准 没有 对 其 
他 声明 做 太 多 约束 ， 所 以 我 们 可 以 对 此 文法 玩 出 各 种 花样 来 。 在 代码 清 
单 13-4 中 ， 除 了 声明 指 疝 数组 的 常量 指针 对 象 r， 其 他 标识 符 周 围 的 () 
都 可 以 省 去 ， 而 语义 不 变 。 





此 外 ， 在 做 类 型 转换 时 ， 如 果 《〈) 内 含有 *， 那 么 此 圆 括 写 可 以 保 
留 ， 这 也 是 为 了 迎合 指 癌 数组 的 指针 与 指向 函数 的 指针 类 型 而 设计 的 ; 
如 果 没 有 *， 则 不 能 加 〈) 。 像 int () 这 种 是 非法 的 类 型 表达 方式 。 


13.3 ”更 复杂 的 声明 





我 们 前 两 节 介绍 了 对 象 类 型 以 及 对 象 与 函数 的 声明 ， 本 万 我 们 将 利 
用 这 些 知 识 构 造 出 更 丰富 且 看 上 去 更 复杂 的 对 象 类 型 。 尺 管 在 大 部 分 时 
候 ， 像 以 下 介绍 的 复杂 类 型 没 太 大 用 武之 地 ， 但 在 关键 时 候 总 能 帮 上 
忙 ， 而 且 一 旦 学 会 对 这 些 类 型 的 解析 ， 那 么 相信 再 复杂 的 语法 特性 也 难 
不 倒 你 了 。 我 们 将 分 三 步 为 大 家 介绍 自己 如 何 编写 或 去 读 懂 一 些 更 复杂 
的 对 象 类 型 以 及 函数 类 型 。 




















13.3.1 将 东 一 类 型 转换 为 指 癌 该 关 型 的 指针 


首先 交 给 大 家 的 是 ， 如 何 表 达 指 同系 一 个 对 象 的 指针 类 型 。 





例 1: 像 比较 简单 的 ， 我 们 已 经 知道 如 果 声 明了 一 个 对 象 a 
a; ， 那 么 对 象 a 的 类型 就 是 int， 而 指 癌 对 象 a 的 指针 关 型 则 是 int* 类 型 。 
当然 正如 上 一 节 所 述 ， 这 里 的 int* 也 可 以 表示 为 int (*) 。 


int 


例 2: 如 果 声 明了 一 个 数组 对 象 4 一 一 int a[3]; ， 那 么 数组 对 象 的 
类 型 为 int[3]， 而 指 癌 数 组 对 象 的 指针 类 型 则 为 int \* ) [3]。 所 以 我 们 
可 以 发 现 ， 要 将 茶 一 类 型 转换 为 指 网 该 类 型 的 指针 其 实 非常 容易 ， 只 需 
要 把 用 该 类 型 声明 的 对 象 标识 符 直 接 符 换 为 〈“*) 即 可 ! 这 里 其 实 就 是 








把 数组 对 象 标识 符 a 变 为 了 (*) 。 


例 3: 如 果 是 一 个 含有 3 个 指向 函数 的 数组 ， 比 如 : 
void (*pArray[3]) (lint) ; ， 如 果 要 获得 指 同 pArray 数 组 对 象 的 指针 类 
型 该 怎么 做 ? 很 简单 ! 直接 将 pArray 变 为 (*) 即 可 一 一 void (* (*) 
[3]) (int) 。 该 类 型 表示 指向 一 个 含有 3 个 元 素 的 数组 的 指针 ， 每 个 元 
素 是 指向 void (int) 类 型 的 函数 指针 。 





13.3.2 ”判定 当前 类 型 属于 哪 种 对 象 类 型 


我 们 了 解 了 上 述 对 象 转 为 指 癌 该 对 象 的 指针 类 型 之 后 ， 接 下 来 就 要 
区 分 该 类 型 的 类 别 ， 也 就 是 说 ， 给 出 的 类 型 是 普通 对 象 类 型 还 是 指针 类 
型 抑或 是 数组 类 型 。 普 通 对 象 类 型 非常 简单 ， 只 要 在 类 型 中 不 出 现 * 
号， 也 不 出 现下 标 符号 的 ， 那 么 就 是 普通 对 象 类 型 。 这 里 难以 区 分 的 
是 ， 当 在 一 个 类 型 中 同时 出 现 了 * 与 以 及 符号 时 ， 如 何 判 别 该 类 型 是 指 
回 一 个 数组 的 指针 还 是 就 是 数组 类 型 。 这 时 ， 我 们 必须 看 类 型 表达 式 中 
最 里 面 的 那个 〈*) 右边 是 否 紧 跟着 一 个 []， 如 果 是 ， 则 表明 它 属于 指向 
数组 的 指针 ; 如果 吕 出 现在 (》 内 ， 跟 在 * 右 边 ， 则 表示 它 古 一 个 数组 对 
象 。 像 13.1.1 节 中 的 例 3 中 的 pArray 就 是 一 个 数组 对 象 ， 因 为 我 们 将 
pArray 标 识 符 拿 挥 之 后 很 明显 就 能 看 到 ，“〈) 里 的 * 后 面 有 一 个 [3]。 而 
&pArray 则 是 指 疝 数组 的 指针 类 型 ， 因 为 它 的 类 型 是 void (* (*) [3]) 











Gint) ， 最 里 面 的 (*) 后 面 直接 跟着 一 个 [3]。 
我 们 这 里 也 举 一 些 例子 。 


例 1: 对 于 void (**funcArray[3]) (〈int) ; ， 对 象 funcArray 就 是 一 
个 数组 ， 而 不 是 一 个 指针 ， 该 数组 中 的 每 个 元 素 是 指向 函数 类 型 
void (int) 的 指针 的 指针 ， 即 void (**) (int)〉 类 型 。 在 C 语 言 中 ，* 作 
用 于 一 个 数组 对 象 或 函数 时 ， 有 没有 图 括号 ， 其 语义 是 完全 不 同 的 。 典 
型 的 例子 有 以 下 这 些 








例 2: int*p[3]; 表示 对 象 p 古 一 个 数组 ， 每 个 元 素 古 int* 类 型 的 对 
象 。 


例 3: int (*q) [3]; 表示 对 象 q 是 一 个 指向 int[3] 数 组 类 型 的 指针 。 


例 4: void*func (int) ; 表示 func 是 一 个 函数 ， 其 类 型 为 


void* (int) 。 


例 5: void (*pFunc) (int) ; 表示 pFunc 是 一 个 指向 void (int) 类 
型 的 函数 的 指针 。 


类 似 地 ， 判 定 一 个 声明 是 声明 一 个 函数 还 是 声明 一 个 对 象 ， 就 看 最 
里 层 的 (*) 后 面 是 否 立 即 跟着 〈) 形 参 列 表 ， 如 果 是 ， 说 明 声 明 的 是 
一 个 指 同 函 数 的 指针 类 型 ， 否 则 说 明 是 一 个 函数 类 型 。 比 如 : 
void (* (float) ) 《int) ;表示 声明 的 是 一 个 函数 类 型 ， 因 为 这 里 面 的 


* 并 不 是 以 (*) 形式 出 现 的 ， 并 且 它 具 有 一 个 float 类 型 的 形 参 ， 返 回 类 
型 为 void (*) (int) ; 。 而 void (* (*) (float) ) (int) ; 表示 指向 
一 个 返回 类 型 为 void (*) (int) ， 并 带 有 一 个 float 类 型 形 参 的 函数 的 指 
针 。 如 果 (*) 后 面 既 没有 直接 跟 [] 数 组 下 标 符 号 ， 也 没有 跟 《〈) 函数 形 
参 列 表 ， 那 么 * 号 两 旁 的 圆 括号 完全 可 省 。 所 以 对 于 函数 声明 来 说 ， 

形 参 列 表 就 对 应 于 数组 声明 的 下 标 。 我 们 可 以 类 比 一 下 int (void) 与 

int[3]， 以 及 int (*) (void) 与 int (*) [3]。 随 后 ， 我 们 通过 代码 清单 
13-5 将 上 面 所 述 的 小 例子 都 串 起 来 。 





代码 清单 13-5 ”更 复杂 的 类 型 声明 





#include <stdio.h> 
static void func(int a) 


printf("a = %d\n", a); 























// MyFunc 的 返回 类 型 为 void (*)(int)， 并 带 有 一 个 float 类 型 的 
static void (* MyFunc(float f) )(int) 





ROS 





printf("f = %f\n", f); 


return &func 


int main(int argc, const char* argv[]) 











// pArray 是 带 有 3 个 void(*)(int ) 类 型 元 素 的 数组 ， 
// 其 类 型 为 : void (* [3])(int) 
void (*pArray[3])(int) = { NULL }; 
































// pla 其 类 型 为 : void (* (*)[3])(int) 
// 注意 里 最 里 面 的 (* ) 两 旁 的 ( ) 不 可 省 
void (* pp)[3]) (int) = = &pArray; 












































pp[0][1] = &func; 
(*pp)[1](10); 


// pFunc 指 向 MyFunc 函 数 ， 其 类 型 为 : void (* (*)(float) )(int) 
void (* (*pFunc)(float))(int) = &MyFunc,; 

















* 











// 这 里 分 别 做 了 两 次 调用 。 第 一 次 调用 的 是 MyFunc， 
// 第 二 次 则 调用 的 是 在 MyFunc 函 数 最 后 所 返回 的 Tunc 函 数 


























pFunc(2.5f)(20); 


当 我 们 知道 了 如 何 表达 自己 想 要 的 类 型 之 后 ， 那 么 下 面 我 们 就 再 看 
一 下 如 何 去 解 析 给 定 的 含有 比较 复杂 类 型 的 对 象 与 函数 。 








13.3.3 ”复杂 复合 闫 型 的 判断 


通 汕 ， 对 于 一 个 含有 指针 符号 的 对 象 来 说 ， 我 们 先 从 最 里 面 《 即 最 
右边 ) 的 * 号 开始 ， 或 者 如 果 类 型 中 含有 多 重 圆 括 号 ， 那 么 从 最 里 面 那 
层 圆 括号 开始 解析 ， 因 为 它 是 离 对 象 标识 符 最 近 的 ， 也 是 最 能 直接 表示 
该 对 象 所 具备 的 第 一 层 类 型 的 。 














例 1: void (* (*pArray) [3]) (int) 。 像 这 里 的 pArray 对 象 是 什么 
类 型 呢 ? pArray 对 象 的 声明 中 含有 指针 ， 也 含有 圆 括 号 ， 我 们 要 判定 其 
类 型 就 从 最 里 面 的 那个 圆 括号 开始 。 最 里 面 的 圆 括号 中 含有 * 号 ， 也 含 
有 pArray 对 象 标识 符 ， 说 明 该 对 象 的 类 别 肯定 是 一 个 指针 。 然 后 看 该 圆 
括号 的 右边 有 没有 跟 下 标 或 函数 形 参 列表 。 我 们 看 到 ， 这 里 右边 紧 跟着 
的 是 [3]， 说 明 pArray 对 象 是 一 个 指向 含有 3 个 元 素 的 数组 的 指针 ， 那 么 
这 一 层 就 结束 了 。 然 后 看 外 面 一 层 ， 这 里 也 是 (*) 的 形式 ， 其 左边 是 
一 个 void 类 型 ， 右 边 是 一 个 〈int) 形 参 列 表 ， 说 明 它 是 一 个 指向 返回 类 
型 为 void， 带 有 一 个 int 类 型 形 参 的 函数 的 指针 类 型 。 这 么 一 分 析 之 后 ， 
我 们 就 可 以 得 到 pArray 对 象 是 一 个 指向 3 个 元 素 的 数组 的 指针 ， 数 组 的 

















每 个 元 系 古 指向 返回 类 型 为 void， 并 带 有 一 个 int 类 型 形 参 的 函数 指针 类 


开 ! 


Eo 己 郑 :。 


人 一 


例 2: int (* (*pFunc) (void) ) [3]。pFunc 对 象 的 类 型 中 也 含有 * 
符号 ， 并 且 也 含有 圆 括号 。 我 们 仍然 从 最 里 面 的 那 层 圆 括号 开始 分 析 。 
最 里 面 的 圆 括 号 中 包含 了 * 符 写 以 及 pFunc 标 识 符 ， 说 明 pFunc 一 定 是 一 
个 指针 。 然 后 看 该 圆 括号 右边 跟着 的 是 (void) ， 它 很 明显 是 一 个 形 参 
列表 ， 表 示 无 任何 形 参 ， 说 明 pFunc 是 一 个 指向 函数 的 指针 类 型 。 最 后 
看 外 面 一 层 圆 括号 ， 也 是 〈*) 的 样式 ， 其 左边 是 int 类 型 ， 右 边 是 [3]， 
说 明 这 是 一 个 指向 int[3] 数 组 的 指针 类 型 。 因 此 ， 我 们 就 可 以 把 pFunc 的 
完整 类 型 给 推断 出 来 一 一 它 是 一 个 指向 不 含 任何 形 参 的 ， 返 回 类 型 为 
int(*) [3] 的 函数 的 指针 。 























例 3: void (**array[3]) (int) 。 对 象 array 的 类 型 中 也 包含 了 * 号 以 
及 圆 括号 。 不 过 由 于 这 里 只 有 一 个 圆 括号 ， 所 以 我 们 可 以 直接 对 圆 括号 
里 的 内 容 进 行 分 析 。 这 里 ，array 标 识 符 没 有 与 某 个 * 进 行 捆绑 在 一 个 圆 
括号 中 ( 即 〈*array) 这 种 形式 ) ， 它 与 * 号 是 分 开 的 ， 然 后 看 array 标 识 
符 后 面 紧 跟着 [3]， 说 明 它 是 一 个 含有 3 个 元 素 的 数组 。 之 后 再 看 标识 符 
所 在 的 圆 括号 中 其 余 内 容 ， 是 两 个 * 号 ， 也 就 是 〈**) ， 再 看 其 右边 跟 
着 的 是 (int) ， 说 明 它 是 一 个 指向 函数 指针 的 指针 ， 在 它 左 侧 看 到 是 一 
个 void 类 型 ， 说 明 函 数 返回 类 型 是 void。 那 么 完整 地 看 array， 其 类 型 为 


一 个 合 有 3 个 元 素 的 数组 ， 数 组 的 每 个 元 素 的 类 型 为 指向 返回 类 型 为 








void， 并 带 有 一 个 类 型 为 int 形 参 的 函数 的 指针 的 指针 。 当 然 ， 像 这 里 的 
array 也 可 以 被 声明 为 : void (* (*array[3]) ) (Cint) 。 即 便 在 *array[3] 
外 围 再 加 一 层 圆 括号 其 实 也 容易 分 析 。 这 么 一 来 就 更 能 看 出 array 是 一 个 
数组 对 象 ， 然 后 array[0] 则 是 一 个 指针 类 型 了 ， 而 最 外 围 的 void (*) 
(Cint) 就 是 array[0] 这 个 指针 所 指向 的 类 型 。 





从 上 面 3 个 例子 可 以 看 出 ， 对 于 诸如 T (*id〉<postfix> 的 声明 而 
言 ，id 就 是 一 个 指针 对 象 ， 而 它 所 指 同 的 类 型 即 为 其 圆 括号 外 围 的 


T<postfix> 类 型 。 
我 们 通过 代码 清单 13-6 来 验证 上 面 所 做 的 类 型 推论 是 否 正确 。 


代码 清单 13-6 ”对 象 类 型 推断 验证 





#include <stdio.h> 


// 在 全 局 作用 域 声 明 一 个 静态 int 类 型 元 素 的 数组 ， 并 对 它 初始 化 
static int SArray[] = { 1, 2, 3 }; 


// 定义 一 个 返回 类 型 为 void， 带 有 一 个 int 类 型 参数 的 静态 函数 func 
static void func(int a) 




































































printf("a = %d\n", a); 








// 定义 一 个 返回 类 型 为 int(* ) [3]， 不 带 有 任 一 形 参 的 静态 函数 Fun 
static int (*Fun(void))[3] 
{ 














return &sArray; 


int main(int argc, const char* argv[]) 





/xx 先 验 证 pArray 对 象 */ 


// 这 里 先 声明 一 个 含有 3 个 元 素 的 数组 对 象 arr， 
// 每 个 元 素 的 类 型 为 指向 void(int ) 函 数 的 指针 
void (*arr[3])(int) = { &func }; 


// 在 文中 己 推断 出 了 pArray 的 类 型 为 指 | 含有 3 个 元 素 的 数组 的 指针 ， 
// te rE 指针 
void (*(*pArray)[3])(int) = &arr; 






















































































// 通过 pArray 指 向 数组 的 指针 来 调用 函数 
pArray[0][0](100); 


/xx 然后 验证 pFunc 对 象 */ 
2 pFunc 古 一 个 指向 函数 的 指 针 ， 该 函数 的 返回 类 型 为 int (*)[3]， 


带 任何 形 参 
int CC pFunc) (void))[3] = &Fun,; 






















































































// 通过 pFunc 做 函数 调用 
// 于 pFunc 所 指 函 数 的 返回 类 型 是 int 2 kl 所 以 pFunc( )[9] 则 是 int[3]， 
// 这 里 的 pFunc()[90] 与 (*pFunc()) 是 

int *p = pFunc()[9]; 

printf("Sum is: %d\n", p[90] + p[1] + p[2]); 
























































/** 最 后 验证 array 对 象 */ 


// array 对 象 类 型 为 含有 3 个 元 素 的 数组 ， 该 数组 的 每 个 元 素 的 类 型 是 void (**)(int), 
// 即 指 癌 返回 类 型 为 void， 带 有 一 个 int 类 型 形 参 的 函数 的 指针 的 指针 
void (** array[3])(int) = {&arr[9] 、 


// 通过 array 数 组 对 象 做 函数 调用 
(*array[90])(10); 



























































通过 代码 清单 13-6， 通 过 一 些 类 型 相对 简单 的 对 象 为 这 些 复杂 类 型 
的 对 象 赋值 ， 我 们 就 能 很 快 验证 出 这 些 类 型 确实 如 上 述 所 推断 的 那样 。 





述 所 描述 的 一 些 例 子 中 对 象 的 类 型 已 经 足够 复杂 了 了， 当然 我 们 还 
可 以 写 出 更 复杂 的 类 型 ， 只 要 大 家 和 掌握 上 面 所 讲 的 关键 点 就 能 比较 容易 
地 判定 某 个 对 象 或 函数 的 类 型 ， 并 且 也 能 自己 写 出 想 要 的 类 型 。 如 果 各 
位 掌握 了 这 部 分 知识 的 话 ， 那 么 可 以 说 基本 已 经 能 够 随意 驾驭 C 语 言 
J 











13.4 _ typedef 类 型 定义 


我 们 上 一 节 介绍 了 比较 复杂 的 对 象 类 型 与 函数 类 型 。 通 常 来 说 ， 我 
们 看 到 那样 复杂 的 类 型 第 一 感觉 就 是 头 军 想 吐 .…… 因 此 C 语 言 引 入 了 类 
型 定义 ， 可 以 将 复杂 的 类 型 抽象 为 一 个 类 型 标识 符 ， 这 样 我 们 就 可 以 直 
接 用 定义 好 的 类 型 标识 符 去 声明 一 个 对 象 或 作为 函数 声明 的 一 部 分 了 。 
C 语 言 中 类 型 定义 的 语法 与 声明 一 个 对 象 的 语法 很 类 似 ， 仅 仅 是 在 最 前 
面 加 上 typedef 关 键 字 。 比 如 ， 我 们 要 用 int 类 型 来 定义 一 个 名 为 INT 的 类 
型 ， 那 么 可 以 这 么 写 : typedef int INT; 。 这 里 也 是 需要 用 分 号 作为 结 
束 符 的 。 我 们 可 以 看 到 ， 如 果 把 typedef 去 掉 ， 那 么 就 相当 于 定义 了 一 个 
名 为 INT 的 对 象 。 而 前 面 一 旦 添加 了 typedef， 那 么 INT 标 识 符 就 不 是 一 
个 对 象 标识 符 ， 而 是 一 个 类 型 标识 符 了 ，C 语 言 标准 也 把 类 型 标识 符 称 


为 typedef 名 (typedef name) 。 














typedef 名 与 结构 体 标 签 、 联 合体 标签 和 枚 举 标签 一 样 ， 都 属于 用 户 
自 定义 类 型 ， 而 且 typedef 也 可 以 放 在 文件 作用 域 和 语句 块 作用 域 中 。 当 
然 ， 如 果 typedef 定 义 的 是 一 个 可 变 修改 类 型 ， 那 么 它 只 能 放 在 语句 块 作 
用 域 中 。typedef 还 能 拒 套 定义 ， 也 就 是 用 一 个 typedef 名 去 定义 另 一 个 类 
型 ， 比 如 : typedefINT MYINT; ， 这 里 用 上 述 定义 好 的 INT 自 定义 类 型 
再 定义 了 一 个 MYINT 这 个 类 型 ， 它 与 INT 都 一 样 ， 都 属于 int 类 型 。 


下 面 我 们 将 分 3 个 部 分 来 描述 typedef 进 行 类 型 定义 的 方式 与 功能 
第 1 部 分 将 介绍 typedef 一 般 的 用 法 ， 我 们 如 何 用 它 来 定义 普通 的 对 象 类 
型 以 及 函数 类 型 ， 并 且 如 何 用 typedef 名 去 声明 一 个 对 象 或 一 个 函数 。 
2 部 分 我 们 将 描述 typedef 如 何 与 限定 符 相 结合 ， 以 及 相 结合 之 后 限定 符 
究竟 限定 什么 类 型 。 第 3 部 分 将 介绍 通过 typedef 来 定义 某 个 结构 体 或 联 


合体 类 型 。 


n> 


13.4.1 ”typedef 的 一 般 使 用 


前 面 已 经 描述 了 ， 使 用 typedef 来 做 类 型 定义 时 ， 其 声明 形式 与 声明 
一 个 对 象 的 形式 非常 类 似 ， 仅 仅 是 在 最 前 面 添加 typedef 关 键 字 。 而 定义 
好 的 类 型 标识 符 就 相当 于 用 于 定义 该 标识 符 的 那个 类 型 。 与 对 象 声 明 一 
样 ， 对 同一 类 型 标识 符 的 定义 在 同一 作用 域 中 可 出 现 多 次 ， 但 所 定义 的 
类 型 必须 都 相同 。 另 外 ， 用 typedef 做 类 型 定义 时 ， 其 声明 只 能 放 在 文件 
作用 域 或 语句 块 作 用 域 ， 而 不 能 声明 在 函数 原型 作用 域 中 。 代 码 清单 
13-7 详 细 描 述 了 typedef 的 一 般 使 用 方式 以 及 一 些 需 要 注意 的 地 方 。 








代码 清单 13-7 typedef 的 一 般 使 用 方式 





#include <stdio.h> 


// 这 里 使 用 了 声明 列表 形式 ， 将 INT 类 型 标识 符 定 义 为 了 int 对 象 类 型 ， 
// 将 FUNC 关 型 标 识 簿 定义 为 了 int (void) 本 玫 关 型， 
// 









































// typedef int INT; 
// typedef int FUNC (void); 
typedef int INT, FUNC (void ) ， 









































// 这 里 再 次 定义 INT， 仍 然 使 
typedef int INT; 


语句 将 出 现 编译 错误 。1 
// 不 能 用 他 生 int 丰 同 的 闫 下 
typedef short INT， 


// 这 里 定义 了 一 个 名 为 ARRAY 
typedef int ARRAY[3]; 


// 以 下 这 条 语句 声明 了 一 个 名 为 func 的 函数 ， 
static FUNC func 


] 类 型 


4int， 没 有 问题 








// 以 下 


已 经 








于 INT 标 识 符 
有 定义 INT 







































































的 数组 类 型 ijnt [3] 






































// 这 里 直接 用 ARRAY 去 声明 一 个 数组 对 象 array，array 的 类 型 
static ARRAY array 








int main(int argc, const char* argv[]) 














// 调用 函数 func 


func() ， 


// 对 array 数 组 进行 赋 人 
for(int i = 0; i < 
array[I] = i; 


// 这 里 用 已 定义 好 的 类 型 INT 又 声明 
// PINT 类 型 为 nt*， 而 PPINT 类 型 
**ppINT; 


typedef INT *PINT, 
了 指针 对 象 p， 

















3; i++) 























了 一 个 PINT 类 型 
为 jnt** 






































// 这 里 用 PINT 声 明 
// p 的 类 型 为 jnt* 








将 它 初始 化 为 指向 ar 















































4 与 PPINT 类 型 


被 定义 为 int， 


J 为 int[3] 





妊 


性 


该 函数 的 类 型 为 FUNC， 即 int(void) 

















ray 数 组 





i 





PINT p = &array[0]; 

// 这 里 用 PPINT 声 明了 指针 对 象 g， 并 用 p 的 地 址 对 它 初始 化 。q 的 类 型 为 jnt** 
PPINT 9q = &p; 

**q += 10; 


printf("array[0] = %d\n", array[90]); 
*q = NULL; 
if(p == NULL) 

puts("p is null!"); 
























































// 这 里 用 PINT* 来 声明 一 个 指针 对 象 r。 由 于 PINT 本 身 是 int* 类 型 ， 
// 所 以 在 对 象 标识 符 r2 前 再 添加 一 个 *， 使 得 r 的 类 型 变 为 了 int** 
PINT *r &p; 

wi = garray[2]; 

if(*p == array[2]) 


puts("Equal!"); 




















// 同样 ， 我 们 这 里 通过 FUNC 类 型 后 面 添加 * 来 声明 一 个 函数 指针 对 象 pFunc。 




















// pFunc 的 类 型 即 为 jnt (*) (void) 
FUNC *pFunc = &func; 

INT a = pFunc(); 

printf("a = %d\n", a); 





















































// 这 里 需要 注意 的 是 ，FUNC 类 型 本 身 是 函数 类 型 ， 
0 一 个 函数 标识 符 只 

它 是 不 允许 作为 左 值 的 ! 所 以 以 下 语句 是 错误 的 
EC aFunc func; 


// 同样 ， 我 们 也 可 





用 它 F 
































以 在 ARRAY 类 型 后 

















明 的 标识 符 





\ 有 在 充当 非 左 值 的 情况 下 才能 隐 式 地 转换 为 指向 函 


是 一 个 函数 ， 而 不 是 一 个 对 象 。 
数 的 指针 对 象 。 


ARRAY *pArray = 


printf("array 


而 添加 * 来 声明 一 个 指向 数组 的 指针 对 象 pPArray 


pArray[9][1]); 


&array 
[1] = %d\n", 











// 类 型 定义 与 对 象 声 明 一 样 ，* 在 不 同 的 位 置 所 表达 的 类 型 语义 有 所 不 同 ， 
// 这 里 ARRAY_PTR 的 类 型 为 int*[3] 
typedef INT* ARRAY_PTR[3]; 


















































// 这 里 PARRAY 的 类 型 为 jnt (*)[3] 
typedef INT (*PARRAY)[3]; 


ARRAY_PTR array2 = { &a, p }; 
printf("The value is: %d\n", *array2[0] + array2[1][0]); 


PARRAY pArray2 = &array; 
if(pArray == pArray2) 
puts("OK!"); 
























































// 我 们 这 里 要 注意 的 是 ， 定 义 一 个 函数 必须 使 用 完整 的 函数 原型 ， 而 不 能 使 用 类 型 定义 的 类 型 标识 符 
static int func(void) 














printf("%s is called!i\n", _ func_  ); 
return 100; 





代码 清单 13-7 展 示 了 typedef 进 行 类 型 定义 的 一 般 用 法 。 我 们 从 中 可 
以 看 到 ， 用 typedef 来 定义 一 个 类 型 标识 符 的 方式 与 声明 一 个 对 象 的 方式 
相当 类 似 。 此 外 ， 用 typedef 定 义 好 的 一 个 类 型 标识 符 可 以 再 次 用 于 定义 
其 他 类 型 ， 并 且 可 以 随意 与 * 号 、 下 标 与 形 参 列 表 相 结合 ， 构 成 种 类 丰 
富 的 指针 类 型 、 数 组 类 型 以 及 函数 类 型 。 用 了 类 型 定义 之 后 ， 原 本 像 指 
向 函数 的 指针 、 指 向 数组 的 指针 等 类 型 项 刻 间 就 变 得 简单 多 了 ， 这 是 C 
语言 对 类 型 的 一 种 抽象 ， 尤 其 用 于 实际 项 目的 开发 过 程 中 还 是 比较 有 用 
的 。 这 可 以 使 得 底层 库 的 实现 者 将 一 些 复杂 的 类 型 抽象 掉 ， 使 得 上 层 开 
发 人 员 不 必 去 关心 某 个 类 型 标识 符 具体 是 哪 种 类 型 ， 而 只 要 适当 使 用 即 
可 。 
































另外 ， 大 家 还 需要 注意 的 是 ，typedef 定 义 好 的 类 型 标识 符 是 属于 类 
型 ， 所 以 我 们 不 能 用 存储 类 说 明 符 去 修饰 类 型 标识 符 ， 而 类 型 标识 符 本 
喘 也 没有 连接 这 一 概念 ， 整 个 类 型 系统 也 不 存在 存储 类 限定 的 说 法 。 








此 存储 类 说 明 符 只 能 用 于 修饰 对 象 与 用 数 ， 表 示 该 对 象 或 函数 所 具有 的 
连接 以 及 存储 属性 和 生命 周期 。 


我 们 之 前 也 谈 到 宏 可 以 用 来 预定 义 茶 个 类 型 ， 那 么 宏 与 typedef 在 用 
于 类 型 定义 时 有 哪些 差异 呢 ? 


首先 ，typedef 可 以 定义 几乎 所 有 类 型 ， 比 如 指 癌 函数 的 指针 类 型 、 
指 问 数 组 的 指针 类 型 等 ， 而 这 一 点 宏 是 做 不 到 的 。 





其 次 ， 宏 用 来 做 类 型 定义 时 ， 我 们 可 以 在 任何 地 方 通过 #undef 去 取 
消 当前 的 宏 定 义 ， 将 当前 宏 蔡 换 成 男 一 种 类 型 ，typedef 则 无 法 实现 取消 
定义 的 处 理 。 





最 后 ， 宏 与 类 型 定义 所 受 影响 的 作用 域 不 一 样 。 宏 完全 属于 文件 作 
用 域 (更 确切 地 说 ， 是 当前 整个 翻译 单元 )， 不 受 语句 块 作用 域 的 影 
啊 ， 而 typedef 定 义 的 类 型 则 具有 文件 作用 域 或 语句 块 作用 域 。 当 然 ， 宏 
与 类 型 定义 在 本 质 上 的 不 同 束 是 ， 宏 属于 预 处 理 ， 独 立 于 C 源 代码 的 正 
式 编译 ;， 而 类 型 定义 则 是 在 编译 期 间 处 理 的 。 





13.4.2 ”typedef 与 类 型 限定 符 相 结合 的 使 用 


前 面 讲 述 了 typedef 类 型 定义 的 普通 用 法 ， 本 节 将 结合 类 型 限定 符 来 
描述 typedef 的 使 用 。 


首先 ， 用 typedef 定 义 的 类 型 标识 符 本 喘 可 以 用 类 型 限定 符 进行 修 
饰 。 其 次 ， 在 typedef 定 义 中 ， 我 们 可 以 将 类 型 限定 符 与 类 型 名 组 合 在 一 
起 来 定义 某 个 类 型 。 如 果 在 用 typedef 进 行 类 型 定义 的 过 程 中 已 经 含有 了 
菏 个 类 型 限定 待 ， 比 如 const， 那 么 在 用 该 定义 的 类 型 标识 符 去 声明 茶 个 
对 象 时 也 伴随 着 同样 的 类 型 限定 答 ， 此 时 不 会 引发 类 型 冲突 ， 见 如 下 代 
码 片 段 所 示 。 








typedef const int CINT; 
CINT const a = 10,; 





上 述 代 码 片 段 中 ， 我 们 用 const int 来 定义 了 一 个 类 型 CINT， 然 后 再 
用 CINT 来 声明 了 一 个 常量 对 象 a。 这 里 我 们 看 到 ， 在 用 CINT 声 明 对 象 a 
的 时 候 ， 还 伴随 着 一 个 const 关 型 限定 符 ， 此 时 编 详 器 不 会 报错 ， 也 不 会 
有 人 警告， 这 条 声明 语句 仍然 有 效 ， 并 且 对 象 a 是 一 个 int 类 型 的 常量 ， 即 


const int 类 型 。 


当 用 typedef 定 义 了 一 个 指针 类 型 之 后 ， 当 它 与 类 型 限定 符 相 结合 时 


完 竟 是 什么 类 型 呢 ? 比如 : 





typedef int *PINT， 
const PINT p; 





这 里 ，PINT 类 型 是 一 个 完整 的 int* 类 型 ， 随 后 我 们 用 PINT 类 型 去 声 
明 一 个 指针 对 象 p， 并 且 在 PINT 之 前 添加 了 const 限 定 符 ， 那 么 这 时 候 ， 
p 究 竟 是 什么 类 型 呢 ? 我 们 在 第 12 章 中 已 经 讲 过 ， 当 类 型 限定 符 限 定 一 





个 类 型 时 ， 如 果 该 类 型 是 一 个 指针 类 型 ， 那 么 看 它 与 * 号 之 间 的 位 置 。 
我 们 在 这 个 代码 片段 中 看 到 ，PINT 就 是 指 代 int* 类 型 ， 根 据 之 前 的 判定 
方式 ， 似 乎 p 应 该 是 const int* 类 型 。 然 而 ， 这 里 的 PINT 是 直接 将 int 与 * 号 
绑 定 在 一 起 的 ， 并 且 从 整个 对 象 声 明 上 来 看 ， 这 里 就 出 现 了 const 限 定 符 
与 CINT 类 型 说 明 符 这 两 个 声明 说 明 符 ， 所 以 这 就 意味 着 这 里 的 const 限 
定 符 限 定 的 是 完整 的 PINT 类 型 ， 即 int*， 所 以 等 同 于 PINT const p; ， 也 
就 相当 于 int*const p; 了 。 





我 们 在 第 12 章 中 己 有 所 描述 ， 对 于 C 语 言 初学 者 来 说 ， 我 们 在 对 一 
个 含有 类 型 限定 符 的 对 象 进行 声明 时 ， 尽 量 将 类 型 限定 符 写 在 所 限定 类 
型 的 后 面 ， 这 样 更 容易 看 出 类 型 限定 符 修饰 的 完 竟 是 什么 类 型 ， 并 且 也 
不 容易 摘 混 。 代 码 清单 13-8 详 细 描 述 了 typedef 定 义 的 类 型 标识 符 与 类 型 
限定 符 相 结合 的 使 用 。 











代码 清单 13-8 ”typedef 类 型 名 与 类 型 限定 符 的 结合 





#include <stdio.h> 


int main(int argc, const char* argv[]) 














// 这 里 定义 了 类 型 PINT， 其 类 型 为 jnt* 
// 并 且 该 定义 与 typedef int* PINT; 等 同 
typedef int (*PINT); 


























int a = 0; 


// 用 PINT 类 型 声明 了 一 个 指针 对 象 p， 并 初始 化 为 指向 对 象 a 的 地 址 
const PINT p = &a; 





















































// 以 下 这 条 语句 错误 。 由 于 p 是 int * const 类 型 ，p 的 值 不 能 被 修改 
p = NULL; 
*p = 10; // 这 条 语句 OK 





printf("a = %d\n", a); 


// 将 CPINT 定 义 为 const int * 类 型 


typedef const int *CPINT; 


// 这 里 用 CPINT 类 型 声明 了 指针 对 象 q， 
// 由 于 这 里 还 用 ] | 因此 q 的 类 型 为 const int* const 
const CPINT 9q = &a 


// 以 下 两 条 语句 均 不 合法 
*q = 10 
q = NULL; 










































































// 这 里 将 PCINT 定 义 为 nt * const 类 型 
typedef int * const PCINT; 












































// 这 里 用 PCINT 声 明了 指针 对 象 r， 并 且 这 里 在 声明 中 也 用 了 const 限 定 符 ， 
// r 的 类 型 仍然 为 int * const 

const PCINT r = &a,; 

*r += 10; // OK 

r = NULL; 不 合法 
































13.4.3 ”用 typedef 来 定义 结构 体 与 联合 体 的 类 型 


nn 
作用 。 这 一 点 我 们 在 实际 项 目 工程 中 会 比较 多 见 ， 比 如 我 们 将 一 个 描述 
和 矩形 位 置 与 宽 高 的 结构 体 定义 为 Rect， 此 时 上 层 应 用 开发 者 无 需 知道 
Rect 究 况 是 一 个 结构 体 还 是 联合 体 或 某 些 类 型 的 组 合 ， 而 是 直接 根据 文 
档 中 的 用 法 去 使 用 即 可 。 我 们 使 用 typedef 也 可 对 枚 举 、 结 构 体 以 及 联合 
体 做 类 型 别名 的 抽象 。 当 我 们 用 typedef 去 定义 某 个 枚 举 、 结 构 体 或 联合 
体 的 一 个 抽象 类 型 时 ， 那 么 用 定义 好 的 类 型 标识 符 去 声明 一 个 对 象 时 ， 
enum、struct 以 及 union 关 键 字 必须 缺 省 。 如 果 不 缺 省 ， 那 么 编译 器 会 根 
据 这 些 类 型 关键 字 去 查找 相应 的 类 型 。 比 如 ， 如 果 有 “typedef struct 
Test{inta，b; }TEST; ”， 那 么 俏 知 我 们 这 么 声明 一 个 Test 结 构 体 对 
象 “struct TEST t; ”， 那 么 编译 器 就 会 报错 : “变量 t{ 具 有 不 完整 类 














型 ‘struct TEST'”。 所 以 ， 我 们 要 么 用 “struct Test t; ”要 么 用 “TEST 


t; ”进行 声明 。 


此 外 ， 我 们 一 般 也 会 用 typedef 将 一 个 匿名 枚 举 、 结 构 体 或 联合 体 来 
定义 为 某 一 抽象 类 型 。 代 码 清单 13-9 给 出 了 更 多 的 用 法 。 


代码 清单 13-9 typedef 用 于 定义 一 个 枚 举 、 结 构 体 和 联合 体 的 情况 





#include <stdio.h> 

















// 通过 typedef 将 结构 体 MyRect 定 义 为 RECT 
typedef struct MyRect 
{ 


struct 


float x, y; 
} positon; 


struct 
float width, height; 


} size; 
} RECT; 























// 这 里 将 一 个 匿名 枚 举 类 型 定义 为 TRAFFIC_LIGHT 
typedef enum 
{ 





RED_LIGHT， 

YELLOW_LIGHT, 

GREEN_LIGHT 
} TRAFFIC_LIGHT 




















// 我 们 可 以 先 用 typedef 定 义 好 一 个 类 型 ， 
// 尽管 此 时 union Vertex_Attr 是 一 个 不 完整 类 型 ， 但 是 不 影响 类 型 定义 


~ 


typedef union Vertex_Attr VERTEX_ATTR; 





















































// 这 里 直接 定义 Vertex_Attr 类 型 即 可 ，typedef 可 省 
union Vertex_Attr 


float position[4]; 
float color[4]; 
}; 


// 这 里 用 typedef 先 定义 了 NODE 类 型 与 PNODE 类 型 
typedef struct Node NODE, *PNODE; 






































struct Node 


{ 


int data; 























// 由 于 之 前 已 经 定义 好 了 PNODE 类 型 ， 因 此 这 里 可 直接 使 用 。 
// link 的 类 型 为 struct Node* 
PNODE lJink; 












































}; 
int main(int argc, const char* argv[]) 


// 这 里 我 们 用 RECT 去 声明 对 象 rect 时 ， 前 面 不 能 添加 struct 关 键 字 
RECT rect = { 10.0f, 20.0f, 50.0f, 60.0f }; 
































// 同样 ， 这 里 TRAFFIC_LIGHT 前 不 能 添加 enum 
TRAFFIC_LIGHT light = GREEN_LIGHT; 

















// 这 里 的 VERTEX_ATTR 前 不 能 添加 union 
VERTEX_ATTR vertexColor = { .color = {0.1f, 0.9f, 0.1f, 1.0f} }; 


printf("The value is: %f\n", 
rect.positon.y + light + vertexColor.color[1]); 














/ 我 们 用 NODE 类 型 声明 了 一 个 node 
4 下 面 我 们 做 一 个 简单 的 线性 单 链表 的 搜索 算法 
NODE node list[3]; 


// 先 为 node_1ist 数 组 的 各 个 成 员 进 行 初 始 化 
node_list[0].data = 1; 
node_list[0].link = &node list[1]; 












































node_list[1].data 
node_1list[1].1link 


2; 
&node_l1ist[2]; 


node_list[2].data = 3; 
node_1list[2].link = NULL; 
// 然后 我 们 声明 对 象 p 作 为 线性 列表 的 表 头 节点 





PNODE p; 


// 下 面 我 们 找到 data 值 为 3 的 那个 节点 
for(p = node list; p != NULL; p = p->link) 




















if(p->data == 3) 
{ 


puts("The node is found!"); 
break; 
} 
} 


if(p == NULL) 
puts("Node not found!"); 





从 代码 清单 13-9 中 我 们 可 以 看 到 ，typedef 用 于 定义 一 个 抽象 的 枚 
举 、 结 构 体 和 联合 体 类 型 时 显得 十 分 灵活 。 当 然 ， 这 里 面 还 没 展示 出 与 
类 型 限定 符 的 结合 ， 但 原理 都 一 样 ， 只 需要 在 typedef 后 面 或 类 型 标识 符 
前 添加 即 可 ， 存 在 * 号 的 情况 下 则 按 自己 的 需要 摆 放 好 位 置 。 我 们 还 看 
到 了 ， 在 使 用 typedef 时 ， 如 果 此 时 用 来 定义 类 型 的 枚 举 、 结 构 体 或 联合 











体 本 里 尚 未 被 定义 ， 那 也 不 影响 类 型 定义 ， 稍 后 可 以 补 上 对 这 些 具 体 类 
型 的 定义 。 


13.5 ”本 章 小 结 


本 章 我 们 更 深入 地 讲解 了 C 语 言 的 类 型 系统 ， 并 且 详 细 地 介绍 了 对 
象 与 函数 的 声明 文法 。 通 过 对 本 章 的 学 习 ， 各 位 对 C 语 言 的 设计 理念 ， 
尤其 是 类 型 系统 的 设计 上 会 有 更 深刻 的 认识 。 本 章 最 后 也 描述 了 C 语 言 
中 的 类 型 定义 使 用 方法 以 及 注意 事项 。 各 位 如 果 将 本 章 学 习 透 彻 ， 那 么 
可 以 次 基本 上 就 踏 入 了 C 语 言 大 师 的 行列 了 。 








至 此 ，C 语 言 标准 中 的 大 部 分 语法 都 讲解 得 差不多 了 ， 下 一 章 将 主 
要 摘 述 C11 标 准 新 引入 的 泛 型 表达 式 与 静态 断言 。 





第 14 章 ”C11 标 准 中 的 表达 式 、 左 值 与 求 值 
顺序 


C11 标 准 细 分 了 17 种 表达 式 ， 而 这 17 种 表达 式 中 有 相互 包含 的 情 
况 。 我 们 先 大 致 看 一 下 这 17 种 表达 式 : 











1) 基本 表达 式 : 包括 了 标识 符 、 和 常量、 字符 串 字 面 量 、 圆 括号 表 
达 式 〈 即 (表达 式 〉 这 种 形式 ) ， 以 及 泛 型 选择 表达 式 。14.2 市 将 详细 
介绍 C11 标 准 新 引入 的 泛 型 选择 表达 式 。 


2) 后 级 表达 式 : 包括 了 基本 表达 式 、 带 有 下 标的 表达 式 《〈 比 如 
array[10])〉、 冰 数 调用 (比如 : Func (10) ) 、 结 构 体 或 联合 体 的 成 员 
访问 《比如 : obj.a 或 pObj->a) 、 后 级 ++ 和 --、 匿 名 结构 体 或 联合 体 的 初 
始 化 列表 〔 比 如: (struct S) {.a=10，.b=20}) 。 


3) 单 目 表达 式 : 包括 了 后 级 表达 式 、 前 级 ++ 和 --、 单 目 操 作 符 结 
合 投射 表达 式 〈 比 如 : - (int) 10.5) 、sizeof 表 达 式 、_Alignof 表 达 式 。 
这 里 要 注意 的 是 ，C 语 言 中 所 规定 的 单 目 操 作 符 只 有 &&、*、+、-、 
~、! ， 前 级 ++ 和 --。 这 里 的 & 表 示 地 址 操作 符 ， 而 不 是 按 位 与 ， 这 里 的 
* 表 示 间 接 操作 ， 而 不 是 乘法 计算 ; 这 里 的 + 和 -表示 正 负 号 ， 而 不 是 加 
和 减 。 








4) 投射 表达 式 : 包括 了 单 日 表达 式 、〈 类 型 名 ) 投射 表达 式 。 比 
如 (Cint) 10.5。 


5) 乘法 表达 式 : 包括 了 投射 表达 式 ， 带 有 乘法 操作 符 、 除 法 操作 
符 或 求 模 操 作 符 的 表达 式 〈 比 如 : 3*5、6/2、7%3) 。 乘 法 表达 式 中 ， 
如 果 含 有 乘法 操作 符 、 除 法 操作 符 或 求 模 操 作 符 ， 那 么 操作 符 左边 是 乘 
法 表达 式 ， 右 边 是 投射 表达 式 。 


6) 加 法 表达 式 : 包括 了 乘法 表达 式 ， 融 有 加 法 操作 符 或 减法 操作 
符 的 表达 式 。 如 果 加 法 表达 式 中 含有 加 法 操作 符 或 减法 操作 符 ， 那 么 操 
作 符 左边 为 加 法 表达 式 ， 石 边 为 乘法 表达 式 。 


7) 移 位 表达 式 : 包括 了 加 法 表达 式 ， 带 有 左 移 或 右 移 的 表达 式 。 
如 果 移 位 表达 式 中 含有 左 移 或 右 移 操作 符 ， 那 么 操作 符 左边 为 移 位 表达 
式 ， 右 边 为 加 法 表达 式 。 


8) 关系 表达 式 : 包括 了 移 位 表达 式 ， 带 有 小 于 、 大 于 、 小 于 等 
于 、 大 于 等 于 操作 符 的 表达 式 。 如 果 关 系 表 达 式 中 含有 小 于 、 大 于 、 大 
于 等 于 或 小 于 等 于 操作 符 ， 那 么 操作 符 左 边 为 天 系 表 达 式 ， 右 边 为 移 位 
表达 式 。 





9) 相等 表达 式 : 包括 了 关系 表达 式 ， 带 有 == 或 ! = 操作 符 的 表达 
式 。 如 果 相 等 表达 陈 中 珊 有 == 或 ! = 操作 符 ， 那 么 操作 符 左边 为 相等 表 
达 式 ， 右 边 为 关系 表达 式 。 


10) 按 位 与 表达 式 : 包括 了 相等 表达 式 ， 含 有 按 位 与 操作 符 & 的 表 
达 式 。 如 果 按 位 与 表达 式 中 含有 按 位 与 操作 符 ， 那 么 操作 符 左 边 为 按 位 
与 表达 式 ， 右 边 为 相等 表达 式 。 





11) 按 位 异 或 表达 式 : 包括 了 按 位 与 表达 式 ， 带 有 按 位 异 或 操作 符 
^ 的 表达 式 。 如 果 按 位 异 或 表达 式 中 含有 按 位 异 或 操作 符 ， 那 么 操作 符 
左边 是 按 位 异 或 表达 式 ， 操 作 符 右边 是 按 位 与 表达 陈 。 








12) 按 位 或 表达 式 : 包括 了 按 位 寞 或 表达 式 ， 带 有 按 位 或 操作 符 | 的 
表达 式 。 如 果 按 位 或 表达 式 禹 有 按 位 或 操作 符 ， 那 么 操作 符 左 边 是 按 位 
或 表达 式 ， 石 边 是 按 位 异 或 表达 式 。 





13) 逻辑 与 表达 式 ; 包括 了 按 位 或 表达 式 ， 带 有 逻辑 与 操作 符 && 
的 表达 式 。 如 宁 逻 辑 与 表达 陈 中 带 有 逻辑 与 操作 符 ， 那 么 操作 符 左 边 为 
逻辑 与 表达 式 ， 右 边 为 按 位 或 表达 式 。 


14) 逻辑 或 表达 式 : 包括 了 逻辑 与 表达 式 ， 禹 有 远 辑 或 操作 符 || 的 
表达 式 。 如 末 逻 辑 或 表达 式 中 和 市 有 远 辑 或 操作 符 ， 那 么 操作 符 左边 为 逻 
辑 或 表达 式 ， 右 边 为 逻辑 与 表达 式 。 

15) 条 件 表达 式 : 包 插 了 过 香 或 表达 趟 ，? ; 缩合 的 三 上 且 表 达 式 。 
三 目 表达 式 的 形式 为 ， 逻辑 或 表达 式 ? 表达 式 ， 条 件 表达 式 。 


名 ， 这 里 对 条 件 表 达 式 的 揣 述 是 Cl1 标 准 中 的 描述 ， 而 我 们 


平时 在 使 用 条 件 表 达 式 的 时 候 应 该 参考 8.2 节 中 描述 的 形式 ， 也 就 是 将 
这 里 ? 之 前 的 表达 式 视 作 为 布尔 表达 式 。 


16) 赋值 表达 式 : 包括 了 条 件 表达 式 ， 以 及 这 种 形式 的 表达 式 ; 单 
目 表 达 式 赋值 操作 符 赋 值 表 达 式 。 赋 值 操作 符 为 以 下 操作 符 


米 研 S /SS、 90=、 十 三 、 -一 、 << 二 、 之 > 三 、 &=、 人 = 二、 |=。 


17) 表达 式 : 这 里 的 表达 式 即 为 基本 表达 式 中 国 括 号 里 的 那个 表达 
式 。 它 包括 了 赋值 表达 式 ， 以 及 这 种 形式 的 表达 式 : 表达 式 ， 赋 值 表达 
式 。 这 也 就 是 我 们 在 8.1 节 中 所 描述 的 逗号 表达 式 。 





我 们 可 以 看 到 ， 表 达 式 的 排列 顺序 表明 了 表达 式 所 涵盖 操作 符 的 计 
算 优 先 级 。 这 里 优先 级 最 高 的 显然 就 是 圆 括号 了 ， 优 先 级 最 低 的 则 是 去 
这 里 各 位 要 着 重 注意 的 是 ， 按 位 操作 符 的 优先 级 小 于 关系 操作 符 
因此 我 们 在 使 用 条 件 判 定语 名 的 时 候 一 定 要 给 按 位 操作 符 加 上 圆 括号 。 
如 代码 清单 14-1 所 示 。 








代码 清单 14-1 ”注意 按 位 操作 符 与 天 系 操作 符 的 优先 级 


#include <stdio.h> 
#include <stdbool.h> 


int main(int argc, const char* argv[]) 





















































int a = 10; 
// 这 里 的 条 件 判断 是 真 ， 后 面 会 输出 OK 
If((a & == 0) 


1) 
puts("OK"); 

















// I 语句 中 相当 于 : 
// a & (1 == 0)， 所 以 先 计算 1 == 0 这 个 相等 表达 式 
// 然后 计算 a & false, 所 以 整个 表达 式 的 结果 为 false 











if(a & 1 == 0) 
puts("Ooops"); 


bool result =a& 1 == 0; 
printf("result = %d\n", result); 


14.1 常量 表达 式 

常量 表达 式 是 指 该 表达 式 在 编译 期 间 就 能 够 被 计算 出 来 ， 而 不 需要 
生成 相应 运行 时 代 吗 。C 语 言 的 常量 表达 式 是 在 < 条件 表 达 式 ”这 个 层 
级 ， 也 就 是 说 赋值 表达 式 不 能 作为 一 个 常量 表达 式 ， 当 然 并 不 是 所 有 在 
条 件 表达 式 这 一 层级 的 表达 式 都 能 作为 常量 表达 式 。 常 量 表 达 式 不 应 该 
含有 赋值 、 递 增 、 递 减 、 函 数 调用 以 及 逗号 操作 符 ， 除 非 它们 作为 包含 
在 一 个 不 被 计算 的 子 表达 式 中 (比如 包含 在 sizeof 操 作 数 中 )。 

对 于 初始 化 器 中 的 常量 表达 式 可 以 有 更 宽松 的 限定 ， 它 可 以 是 ; 

1) 一 个 算术 常量 表达 式 ; 

2) 一 个 空 指针 常量 ， 

3) 一 个 地 址 常量 ，; 

4) 一 个 完整 对 象 类 型 的 地 址 常量 加 上 或 减 去 一 个 整数 常量 所 构成 
的 一 个 表达 式 。 

一 个 算术 常量 表达 式 应 该 具有 算术 类 型 ， 并 且 其 操作 数 应 该 仅 为 整 


数 第 量 、 浮 点 常量 、 字 符 第 量 、 不 合 有 可 变 修改 类 型 的 sizeof 表 达 式 ， 


以 及 _Alignof 表 达 式 。 而 在 一 个 算术 种 量 表达 陈 中 的 投射 操作 也 应 该 只 








古 将 一 种 算术 类 型 转换 为 为 一 个 算术 类 型 ， 除 非 作 为 sizeof 与 _Alignof 的 
操作 数 。 


我 们 要 判定 一 个 表达 式 是 否 为 常量 表达 式 其 实 比较 简单 ， 我 们 对 一 
个 全 局 对 象 进行 初始 化 ， 如 果 能 通过 编译 ， 那 么 为 它 初 始 化 的 表达 式 吏 
基本 是 一 个 和 常量 表达 式 ， 人 否则 它 就 不 是 一 个 第 量 表达 式 。 代 码 清早 14-2 
展示 了 判定 第 量 表达 式 的 方法 。 


代码 清单 14-2 ”常量 表达 式 的 判定 





#include <stdio.h> 

#include <stdint.h> 
/ 这 里 声明 个 静态 变量 对 象 a， 且 这 里 的 100 是 一 个 常量 表达 式 
static int a = 100; 


// 由 于 静态 文件 作用 域 对 象 a 不 是 一 个 常量 ， 所 以 这 里 的 a 不 是 
// 这 条 语句 会 引发 编译 错误 一 初始 化 器 元 素 不 是 一 个 编译 时 常量 
static int b = a; 


































































































> 
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表达 式 。 


















































// 这 里 用 const 声 明了 一 个 常量 对 象 C， 0 - 100) / 2 是 一 个 常量 表达 式 
static const int c = (200 - 100) / 


// 由 于 对 象 c 是 一 个 常量 ， 所 以 这 里 的 (c + 2) << 1 是 一 个 常量 表达 式 
static const int64 t d = (sizeof(c) + 2) << 1; 


















































// 整个 (sizeof(d) > sizeof(c))? sizeof(d) + 1 : sizeof(c) - 1 表达 式 ， 
// 是 一 个 常 量 表 这 式 
static int e = (sizeof(d) > sizeof(c))? sizeof(d) + 1 : sizeof(c) - 1; 


// 如 果 一 个 常量 表达 式 作 为 一 个 初始 化 器 ， 那 么 它 可 以 是 一 个 地 址 常量 。 
// 这 里 ，&e 这 个 表达 式 就 是 一 个 地 址 常量 
int *p = &e; 


// 在 GCC 与 Clang 中 ， 被 const 修 饰 的 一 个 常量 对 象 也 能 作为 初始 化 器 的 一 个 常量 表达 式 ， 

// 但 在 MSVC 中 却 不 被 多 许 ，C 语 言 标准 没有 指定 const 修 饰 的 对 象 是否 能 作为 一 个 常量 表达 式 ， 
// 但 C 语 言 标准 声明 了 ， 人 允许 C 语 言 实现 接受 其 他 形式 的 常量 表达 式 

static int64 t maybeError = C + d; 



































































































































int main(int argc, const char* argv[]) 


printf("a = %d, c = %d, d = %lld, e = %d\n", a, c, d, e); 








代码 清单 14-2 列 举 了 一 些 能 作为 常量 表达 式 的 表达 式 形式 。 对 于 向 


量 表达 式 而 言 ， 比 如 上 述 的 〈200-100) /2， 在 实际 编译 后 的 二 进 制 代码 
中 不 会 包含 整个 计算 表达 式 的 过 程 ， 而 仅仅 是 一 个 计算 结果 ， 即 50。 如 
果 在 函数 中 出 现 像 int a= 〈200-100) /2; 这 种 语句 ， 最 终 整 条 语句 对 应 

的 指令 可 能 仅仅 就 是 “mov reg，50”， 假 设 reg 表 示 变 量 a 所 在 的 寄存 器 ， 

而 不 会 有 减法 、 除 法 等 指令 出 现 ， 这 些 计算 全 都 由 编译 器 负责 计算 。 














当然 ， 一些 编译 器 可 能 会 根据 上 下 文 对 代码 进行 优化 。 比 如 像 int 
a=100; 和 int b=a+50; 这 两 条 语句 中 ，a 和 和 b 都 是 变量 ， 但 是 在 编译 int 
b=a+50; 这 人 句 时 编译 絮 可 能 会 直接 将 它 编译 为 : mov reg，150， 假 设 reg 
表示 变量 b 所 用 的 寄存 器 。 然 而 在 C 语 言语 法 上 ，a+50 仍 然 不 属于 常量 











14.2 ” 泛 型 选择 表达 式 


泛 型 选择 表达 式 是 C11 标 准 新 引入 的 一 个 重大 语法 特性 。 它 可 以 使 
得 C 语 言 使 用 轻 量 级 的 泛 型 机 制 ， 其 表达 形式 如 下 : 


_Generic (赋值 表达 式 ， 泛 型 关联 列表 ) 





这 里 的 “赋值 表达 式 ? 其 实 束 是 我 们 在 本 章 开 头 所 列 出 的 第 16 条 表达 
式 ， 也 是 范围 第 二 大 的 。 而 泛 型 关联 列表 的 形式 是 一 组 用 去 号 分 隔 的 类 
型 与 表达 式 相 联结 的 表达 式 ， 形 式 为 : 





类 型 名 : 赋值 表达 式 。 








整个 泛 型 选择 表达 式 的 语义 为 : C 语 言 实现 先 获 取 最 左边 的 赋值 表 
达 式 的 类 型 ， 这 里 要 注意 的 是 ， 此 获取 类 型 的 动作 与 sizeof 表 达 式 一 
样 ， 仅 获取 类 型 而 不 对 表达 式 做 计算 ， 也 不 会 生成 相关 的 运行 时 代码 ; 
然后 将 获取 到 的 类 型 与 泛 型 关联 列表 中 每 一 个 “类 型 名 ?部 分 进行 比较 ， 
如 果 两 者 兼容 则 选择 该 “类 型 名 ”所 对 应 的 赋值 表达 式 作为 整个 沁 型 表达 
式 的 计算 结果 ， 否 则 跳 过 当前 的 泛 型 关联 ， 尝 试 罗 配 下 一 条 。 其 中 ， 类 
型 名 部 分 还 可 以 用 default 来 表示 当 泛 型 关联 列表 中 没 找到 与 最 左边 的 赋 
值 表达 式 的 类 型 相 匹 配 的 类 型 时 所 选 出 的 表达 式 。 





代码 清单 14-3 列 举 了 泛 型 选择 表达 式 的 基本 用 法 以 及 一 些 注意 事 


项 


~o 


代码 清单 14-3” 泛 型 选择 表达 式 的 基本 使 用 





#include <stdio.h> 
int main(int argc, const char* argv[]) 


{ 
// 这 里 列举 了 一 个 简单 的 泛 型 选择 表达 式 。 
// 该 表达 式 中 ， 对 表达 式 100 进 行 获取 类 型 ， 然 后 对 后 面 的 泛 型 关联 进行 匹配 。 
// 我 们 知道 109 属 于 int 类 型 ， 因 此 最 终 整 个 泛 型 选择 表达 式 的 结果 为 表达 式 1。 
// 这 条 语 名 在 编译 完成 后 其 实 就 相当 于 : int a = 1; 
int a = _Generic(100, float:-1, int:1, default: De 
printf("a = %d\n", a); // 这 里 输出 : a = 1 


// 在 这 条 泛 型 选择 表达 式 中 ， 

// (++a，a + 1.,5f) 这 一 逗号 表达 式 最 终 计 算出 的 类 型 是 float， 

// 由 于 泛 型 选择 表达 式 中 最 左边 用 于 类 型 匹配 源 的 赋值 表达 式 不 被 计算 ， 
// 所 以 这 里 的 ++a 没 有 任何 效果 








































































































































































































a = _Generic((++a, a + 1.5f), int:a + 10, float:a + 100, 
double:a + 1000, default:a); 
printf("second a = %d\n", a); // 这 里 输出 : a = 101 


// 尽管 在 一 般 赋 值 表达 式 中 ，float 能 隐 式 地 转换 为 double 类 型 ， 
// 但 是 在 泛 型 选择 表达 式 中 ， 类 型 匹配 是 相当 严格 的 1 a + 1.5f 是 float 类 型 ， 
// 那么 由 于 在 这 里 找 不 到 float 类 型 ， 
// C 语 言 实现 就 会 选择 default 中 的 表达 式 作为 整个 泛 型 选择 表达 式 的 结果 。 
// 这 条 语句 就 相当 于 a = a; 其 实 就 如 同一 条 空 语句 
a = _Generic(a + 1.5f, int:a + 10, long:a + 100, 

double:a + 1000, default: a); 
printf("third a = %d\n", a); // 这 里 仍然 输出 : a = 101 

























































































const char *output = "none"; 
// 当 我 们 的 匹配 源 表达 式 是 一 个 字符 串 字面 量 的 时 候 必须 注意 ， 
// C 语 言 标准 中 是 将 字符 串 字面 量 视 作 为 char* 类 型 ， 但 有 些 C 语 言 实现 在 匹配 泛 型 关联 的 时 候 ， 
// 可 能 仍然 会 将 字符 串 类 型 设 定 为 const char [N] ，N 表 示 字 符 串 中 字符 个 数 再 加 一 个 ^\9 结束 符 。 
// 因此 使 用 时 应 当 小 心 ， 尽 量 使 用 投射 操作 做 显 式 的 类 型 转换 
output = _Generic("abc", const char* : "const char*", char* ; "char*", 
const char[4] : "const char[4]", 
char[4] : "char[4]"); 


// 我 们 尝试 下 面 这 条 语 
// 会 看 到 当前 编译 颖 让 做 编译 报错 时 仍然 会 把 "abc" 作 为 char [4] 或 const char[4] 类 型 
"abc" = 100; 

























































































































































































printf("output is: %s\n", output); 


Struct Point { int x, y; }; 
struct Size { int width, height; }; 
struct Point p = { }; 


结构 体 的 类 型 匹配 也 同样 如 此 
output = _Generic(p, struct Point:"Point", 
struct Size:"Size", default:"none"); 
printf("p is a %s\n", output); 





int x, y; 


// 下 面 我 们 通过 投射 操作 加 逗号 表达 式 作为 泛 型 关联 ， 分 别 给 x、y 两 个 对 象 进行 初始 化 。 
// 我 们 在 每 个 泛 型 关联 中 的 表达 式 的 前 面 加 上 (void)， 表 示 整 个 表达 式 为 void 表 达 式 。 
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// 要 注意 ， 如 果 一 个 泛 型 关联 中 出 现 多 个 赋值 表达 式 ， 需 要 用 去 号 分 隔 ， 不 能 使 ) 使 用 分 
// 此 外 ， 需 要 给 这 些 赋 值 表达 式 加 上 圆 括号 ， 以 防止 逗号 作为 泛 型 关联 的 分 隔 符 
_Generic(x + y, int:(void)(x = 1, y = 2)， 

float:(void)(x = 0.1f, y = 0.2f), default:(void)0); 























3 








printf("x = %d, y = %d\n", x, y); 





泛 型 选择 表达 式 最 常用 的 是 用 于 做 一 些 标准 库 。 比 如 ， 像 C 语 言 标 
准 库 中 不 少数 学 函数 部 带 有 类 型 前 级 与 后 经， 通过 泛 型 表达 式 我 们 可 以 
将 这 些 前 级 与 后 级 给 应 用 开发 者 给 抽象 挥 ， 不 其 露出 来 ， 这 样 便于 开 友 
者 更 便捷 地 使 用 这 些 标准 库 API。 下 面 再 举 一 些 例子 来 说 明 这 种 用 法 。 





代码 清单 14-4” 泛 型 选择 表达 式 用 于 标准 库 的 制作 





#include <stdio.h> 
#include <math.h> 
#include <stdlib.h> 





























// 这 里 定义 了 一 个 gen_abs 宏 函数 ， 用 于 判定 expr 表 达 式 的 类 型 。 

// 如 果 是 int， 则 使 用 abs 库 函数 ， 如 果 是 1ong， 则 使 用 Labs; 

// 如 果 是 float， 则 使 用 fabsf 库 函数 ， 如 果 是 double， 则 使 用 fabs 库 函数 ; 

// 如 果 是 long double， 则 使 用 fabs1l 库 函数 ， 默 认 使 用 fabs 

#define gen_abs(expr) _Generic((expr), int:abs, long:labs, float:fabsf, \ 
double:fabs, long double:fabsl, default:fabs) \ 


(expr) 


// 这 里 定义 了 一 个 gen_pow 宏 函数 ， 判 定 base + exponent 这 一 表达 式 的 类 型 

#define gen_pow(base, exponent) _Generic((base) + (exponent), \ 
float:powf, 
double:pow, long double:powl, \ 
default:pow) (base, exponent) 
































































































































int main(int argc, const char* argv[]) 


// 由 于 一 100 表 达 式 是 int 类 型 ， 所 以 这 里 选择 了 abs 另 外 这 里 再 要 提醒 各 位 的 是 ， 
// 一 个 函数 标志 用 在 表达 式 中 则 默认 表示 为 一 个 指向 函数 的 指针 类 型 ， 

// 所 以 这 里 整个 泛 型 选择 表达 式 的 结果 为 : abs (-100) 

int a = gen_abs(-100); 


// 由 于 1000L 表 达 式 是 long 类 型 ， 所 以 这 里 选择 了 labs 
long 1 = gen_abs(1000L); 


// 由 于 9.5f 表 达 式 是 float 类 型 ， 所 以 这 里 选择 了 fabsf 
float f = gen_abs(0.5f); 







































































































































































printf("value = %f\n", a + 1 + f); 


// 这 里 base 的 类 型 为 float，exponent 的 类 型 为 6.0， 两 者 相 加 的 类 型 则 取 double。 
// 因此 ， 这 里 泛 型 选择 的 最 终 表 达 式 为 pow(2.0f，6.0) 



































double d = gen_pow(2.0f, 6.0); 
printf("d = %d\n", (int)d); 





我 们 在 使 用 泛 型 表达 式 的 时 候 必 须要 注意 ， 在 泛 型 关联 列表 中 不 能 
出 现 两 个 一 样 的 类 型 ， 也 不 能 找 不 到 任何 与 赋值 表达 式 的 类 型 匹配 的 泛 
型 关联 ， 人 否则 会 引发 编译 报错 。 对 于 无 法 找到 所 匹配 类 型 的 情况 ， 我 们 
应 该 要 加 上 default 汉 型 关联 。 男 外 ， 泛 型 关联 中 类 型 后 面 要 跟 的 是 一 个 
表达 式 ， 而 不 是 一 条 语句 ， 所 以 不 能 出 现 分 写 ， 也 不 能 出 现 们 这 种 语句 
块 。 








除了 上 述 提 到 的 基本 类 型 外 ， 对 于 我 们 自 定义 的 枚 举 、 结 构 体 、 联 
合体 类 型 以 及 各 种 指针 类 型 也 都 可 以 用 泛 型 表达 式 。 然 而 ， 当 泛 型 关联 
中 的 表达 式 为 赋值 表达 式 时 ， 当 前 主流 的 C 语 言 编 译 器 《包括 GCC 5.4 
以 及 Clang 3.8) 对 用 户 自 定 义 类 型 的 泛 型 选择 文 持 都 不 太 好 ， 因 此 我 们 
当前 应 尽量 使 用 C 语 言 中 的 基本 类 型 作为 匹配 类 型 ， 等 以 后 C 编 译 器 完 
善 了 再 使 用 用 户 自 定义 类 型 也 不 返 。 








14.3 ”静态 断言 
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言 是 一 条 声明 ， 即 一 条 语句 ， 而 不 是 表达 式 ， 不 过 这 个 语法 
特性 在 其 他 章节 讲 也 不 是 十 分 合适 ， 所 以 就 放 到 这 里 介绍 。 


静态 断言 的 语法 形式 为 : 




















_Static_assert (常量 表达 式 , 字 符 串 字面 量 ) ; 














它 表 示 : 如 果 第 量 表达 式 的 值 为 假 〈( 即 计算 结果 为 0 或 者 是 一 个 空 
指针 ) ， 那 么 断言 失败 ，C 语 言 实现 将 在 编译 时 产生 一 条 诊断 信息 ， 诊 
断 信息 中 包含 后 面 字符 串 字 面 量 的 信息 ; 如 果 常 量 表达 式 的 值 计算 结 
为 真 ， 那 么 断言 成 功 ， 该 声明 不 起 任何 作用 。 各 位 要 注意 的 是 ， 这 里 的 
常量 表达 式 必 须 是 一 个 整数 利 量 表达 式 。 一 个 整数 常量 表达 陈 应 该 具有 
整数 类 型 ， 并 且 其 操作 数 应 该 仅 为 整数 第 量 、 枚 举 常 量 、 字 符 第 量 、 
sizeof 表 达 式 、_Alignof 表 达 式 ， 以 及 经 过 整数 类 型 投射 操作 的 浮上 反常 
量 。 此 外 ， 这 里 的 sizeof 与 _Alignof 的 操作 数 不 应 该 是 可 变 修改 类 型 。 而 
像 一 个 地 址 第 量 等 表达 式 在 这 里 都 不 能 作为 一 个 整数 第 量 表达 式 。 


























我 们 在 使 用 静态 断言 的 时 候 应 该 添加 上 标准 库 头 文件 <asserth>， 然 


后 直接 使 用 预定 义 的 宏 函 数 static_assert， 而 不 是 直接 使 用 
_Static_assert。 代 码 清 单 14-5 展 示 了 静态 断言 的 基本 使 用 方式 与 效果 。 


代码 清单 14-5 ”静态 断言 的 基本 使 用 与 效 末 





#include <stdio.h> 
#include <assert.h> 
#include <stdbool.h> 


int main(int argc, const char* argv[]) 

















// 这 里 常量 表达 式 直 接 是 真 值 ， 所 以 断言 成 功 ， 不 产生 任何 效 表 
































static assert(true, "This is true"); 
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// 这 里 常量 表达 式 直 接 是 一 个 假 值 ， 所 以 断言 失败 ， 编 译 器 将 产生 诊断 信息 











static assert(false, "This is false"); 


int a = 10; 

















// 由 于 这 里 &a 不 是 一 个 整数 常量 表达 式 ， 所 以 编译 器 直接 报错 : 























// 静态 断言 表达 式 不 是 一 个 整数 常量 表达 式 


static assert(&a, "&a is not null!"); 



































// 由 于 sizeof(a) 的 大 小 不 为 0， 因 此 断言 成 功 ， 这 里 不 产生 




















王 何 效果 








static assert(sizeof(a), "p is null!"); 


enum COLOR { RED, GREEN, BLUE }; 












































// 由 于 枚 举 常量 RED 是 9， 所 以 这 里 断言 失败 ， 编 译 器 将 产生 诊断 信息 


























static _assert(RED, "This is red color"); 








从 代码 清单 14-5 我 们 可 以 看 到 ， 使 用 静态 断言 的 条 件 非 党 有限。 我 
们 一 般 用 静态 断言 对 当前 编译 环境 进行 判定 ， 而 决 不 能 用 于 对 运行 时 对 





象 值 的 判定 。 





14.4 “C 语 言 中 的 左 值 





关于 编程 语言 中 的 “ 左 值 >?， 一 般 通 俗 地 来 说 束 是 可 作为 = 赋值 操作 
符 左 侧 操 作 数 的 表达 式 ， 这 也 意味 着 等 写 左 侧 的 表达 式 要 求 是 一 个 可 被 
修改 的 左 值 。C11 标 准 给 C 语 言 的 左 值 做 了 明确 的 定义 : 一 个 左 值 表达 
式 能 隐 式 地 用 来 表示 一 个 对 象 ， 如 宁 一 个 左 值 在 计算 时 无 法 用 来 表示 一 
个 对 象 ， 那 么 行为 是 未 定义 的 。 一 个 可 修改 的 左 值 不 能 是 一 个 数组 类 
型 ， 不 能 是 一 个 不 完整 类 型 ， 不 能 有 const 限 定 符 修 饰 ， 并且 如 果 该 左 值 
古 一 个 结构 体 或 联合 体 类 型 的 话 ， 其 任 一 成 员 也 不 能 有 const 限 定 符 修 
饰 。 








当 一 个 左 值 作为 单 目 & 操 作答、++ 操 作 符 、-- 操 作 符 的 操作 数 ， 或 
成 员 访 问 操 作 符 .和 赋值 操作 符 = 的 左 操作 数 时 ， 整 个 表达 式 就 不 具备 左 
值 特 性 了 ， 这 在 C 语 言 中 称 为 左 值 转换 。 





下 面 我 们 就 通过 代码 清单 14-6 来 举 一 些 左 值 表达 式 以 及 非 左 值 表达 
式 的 例子 。 


代码 清单 14-6”C 语 言 中 的 左 值 





#include <stdio.h> 
int main(int argc, const char* argv[]) 


int a = 10; 
int *p; 











// 这 里 的 a 是 一 个 左 值 
a += 5) 


// 这 里 的 p 是 一 个 左 值 
p = &a; 


// 当 a 作 为 ++ 操 作 符 的 操作 数 时 ， 它 就 不 再 是 左 值 了 。 
// 所 以 a++ 表 达 式 不 是 左 值 ， 不 能 作为 = 操 作 符 的 左 操作 数 。 这 条 语句 将 会 引发 编译 错误 
// at++ = 0) 


// ek i 
int array[5] = { 1, 2, 3 }; 


// 数组 类 型 的 对 象 不 能 作为 左 值 ， 所 以 它 也 不 能 作为 = 操作 符 的 左 操作 数 ， 以 下 语句 会 引发 编译 错误 
array = (int[]){ 4, 5, 6 }; 


// array[1] 表 达 式 是 一 个 左 值 


array[1]++， 




































































// main 是 int (int, const char**) 的 函数 类 型 ， 不 能 作为 左 值 
main = NULL; // 这 条 语句 将 会 引发 编译 错误 





int (*pFunc)(int, const char**); 


// pFunc 是 指向 函数 的 指针 类 型 ， 可 以 作为 左 什 


pFunc = &main; 


// 这 条 语句 将 会 引发 编译 错误 。 作 为 = 操作 符 的 左 操作 数 之 后 ， a 就 不 再 作为 左 值 ， 
// 因此 整 (a = 10) 表 达 式 不 是 一 个 左 值 ， 它 不 能 作为 = 操作 符 的 左 操作 数 
(a = 10) = 100; 























p = array, 


a = 0; 
// at++ 不 是 一 个 左 值 表达 式 ， 但 p[a++] 表 达 式 是 一 个 左 值 
p[a++] = 30; 














// 当 左 值 p[a] 作为 & 的 操作 数 之 后 就 不 再 是 左 值 ， 因 此 以 下 语句 将 会 引发 编译 错误 
&p[a]l = NULL 


// 而 当 &p[a] 前 面 再 加 * 进 行 解 引用 之 后 ，*&p[a] 表 达 式 又 再 度 成 为 了 左 值 
“&p[a] += 10; 




























































































代码 清单 14-6 中 后 面 牵涉 指针 的 引用 与 解 引 用 部 分 可 能 会 感觉 比较 

` 过 从 逻辑 上 很 容易 理解 ， 我 们 取 一 个 对 象 的 地 址 时 得 到 的 是 该 对 
象 的 地 址 值 ， 地 址 值 是 不 能 被 修改 的 ， 因 此 对 对 象 的 引用 自然 就 是 一 个 
常量 ， 不 能 作为 一 个 左 值 了 。 而 取 一 个 指针 的 内 容 时 ， 由 于 前 面 没 有 
const 修 饰 ， 自 然 就 能 访问 相应 地 址 的 数据 内 容 ， 因 此 解 引 用 表达 式 很 自 
然 就 能 作为 左 值 。 





另外 ， 代 码 清单 14-6 也 上 暗示 了 ， 当 一 个 函数 标志 作为 表达 式 时 ， 只 
有 当 它 扮演 “ 右 值 * 时 ， 其 类 型 才 会 被 隐 式 转 为 指 癌 该 函数 的 指针 类 型 ， 
否则 它 依 然 保 持 为 函数 类 型 。 男 外 ， 当 一 个 函数 标志 后 面 跟 着 〈) 后 级 
操作 符 表 示 函 数 调 用 时 ， 该 函数 标志 就 不 再 是 一 个 左 值 了 ， 它 具有 指 问 
该 函数 的 指针 类 型 。 对 于 一 个 数组 对 象 ， 通 常 它 均 以 指向 其 元 素 类 型 的 
指针 的 形式 作为 表达 式 的 ， 除 非 作 为 单 目 操作 符 八 、sizeof、_Alignof 等 
操作 符 的 操作 数 时 ， 保 留 其 数组 类 型 。 








“ 右 值 ? 在 C11 标 准 中 被 描述 为 “一 个 表达 式 的 值 ”， 在 7.4 节 也 有 过 一 
些 介绍 。 不 过 右 值 这 个 概念 在 C 语 言 中 用 得 不 多 ， 因 为 C 语 言 的 类 型 系 
统 相 对 来 说 还 是 比较 简单 的 ， 而 C++ 则 要 复杂 许多 ， 并 且 也 会 频繁 用 到 
右 值 这 个 概念 《比如 C++11 的 右 值 引用 ， 等 等 ) 。 所 以 各 位 务必 不 要 混 
消 了 C 语 言 跟 C++ 语 言 对 左 值 和 右 值 的 概念 ， 两 者 是 不 太一 样 的 。 
C++ 是 将 右 值 定义 为 “作为 一 个 临时 对 象 ”， 显 然 范 围 比 C 语 言 的 要 广 很 
多 。 











下 面 举 个 例子 。 在 C 语 言 中 ， 我 们 把 之 前 6.2.3 节 中 提 到 的 匿名 结构 
体 、6.3 节 中 提 到 的 匿名 联合 体 以 及 7.1 节 中 提 到 的 匿名 数组 统称 为 复合 
字面 量 (compound literal) 。C 语 言 标准 对 复合 字面 量 的 定义 很 明确 : 
由 一 个 圆 括号 包 起 来 的 类 型 名 后 面 跟着 用 花 括 号 包 起 来 的 初始 化 器 列表 
所 构成 的 一 个 后 级 表达 式 。 复 合 字面 量 提供 了 一 个 匿名 对 象 ， 其 值 由 初 
始 化 器 列表 提供 。 在 标准 中 ， 这 个 定义 有 一 个 脚 标 ， 注 明了 : 复合 字面 

















量 与 投射 表达 式 不 同 。 比 如 ， 投 射 操作 仅仅 指定 了 对 标量 类 型 或 void 类 
型 的 转换 ， 并 且 投 财 表 达 式 的 结果 不 是 一 个 左 值 。 这 人 句 话 非常 关键 ， 信 
县 量 庞大 ! 这 其 实 已 经 意味 着 复合 字面 量 可 以 作为 元 值 使 用 ， 而 且 实际 
上 也 确实 如 此 。 但 在 C++ 中 将 这 种 类 似 的 、 产 生 匿 名 对 象 的 表达 式 称 为 
石 值 。 我 们 看 一 下 代码 清单 14-7 所 示 的 C++14 代 码 。 




















代码 清单 14-7 C++14 语 言 中 的 临时 对 象 





int main(void) 
{ 
struct Test 


int a, b; 
void set(int i) {a=i;b=i+1;} 




















// 这 里 的 表达 式 Test{ 10，20 } 是 一 个 右 值 
Test{ 10, 20 }; 

// C++14 中 允许 对 一 个 临时 对 象 ， 即 一 个 右 值 调用 非 const 方 法 来 修改 其 成 员 值 
Test{ 10, 20 }.set(100); 


// 但 是 以 下 3 条 语句 都 是 错误 的 。 | 

// 在 C++14 标 准 中 不 允许 对 临时 对 象 做 取 地 址 操作 ， 也 不 允许 修改 该 临时 对 象 的 成 员 值 
Test *p = &Test{ 10, 20 }; 

Test{ 10, 20 }.at+; 

Test().a = 0; 



























































代码 清单 14-7 中 可 以 看 出 ，C++14 中 的 临时 对 象 其 实 是 一 个 右 值 ， 
所 以 不 能 对 它 做 取 地 址 操作 ， 也 不 能 做 上 自 增 自 减 等 修改 操作 。 但 是 
C++ 因为 有 成 员 方 法 这 个 特性 ， 所 以 可 以 通过 成 员 方法 来 修改 其 成 员 属 
性 的 值 。 因 此 ， 从 这 个 角度 上 来 看 ，C++ 中 所 谓 的 右 值 并 不 是 严格 意义 
上 不 可 修改 的 。 然 后 ， 我 们 再 看 看 C11 标 准 中 的 对 复合 字面 量 的 对 待 情 
况 ， 见 代码 清单 14-8。 




















代码 清单 14-8 ” ”C11 语言 中 的 复合 字面 量 








int main(int argc, const char * argv[]) 


// 对 匿名 数组 做 取 地 址 操作 毫 无 问题 
int (*p)[3] = &(int[]) { 1, 2, 3 }; 


// 对 匿名 数组 做 元 素 修 改 也 毫 无 问题 
(int[]) { 1, 2, 3 }[1]++; 








struct Test { int a, b; }; 


// 对 匿名 结构 体 做 成 员 修改 毫 无 问题 
(Struct Test) { 10, 20 },a++' 


// 对 匿名 结构 体 做 取 地 址 操作 也 毫 无 问题 
struct Test *t = &(struct Test) { 10, 20 }; 























我 们 对 比 代 码 清 单 14-7 与 代码 清单 14-8 可 以 清晰 地 看 出 ， 对 待 临时 
匿名 对 象 ，C++ 与 C 语 言 的 方式 是 截然 不 同 的 。 笔 者 之 所 以 在 此 花费 大 
量 笔墨 描述 C 语 言 与 C++ 语言 对 于 右 值 概念 的 区 别 ， 主 要 原因 聘 是 笔者 
在 工作 时 以 及 在 一 些 技术 社区 经 常 发 现 许多 程序 员 会 把 这 两 个 编程 语言 
的 左 值 和 石 值 概念 搞 混 。 这 也 是 由 于 C++ 与 C 语 言 的 兼容 性 比较 强 所 导 
致 的 ， 所 以 不 少 程序 员 会 习惯 性 地 把 C++ 的 一 些 概念 搬 到 C 语 言 上。 在 
大 部 分 情况 下 可 能 没什么 问题 ， 但 这 两 者 在 不 少 细节 上 还 是 有 一 些 差别 
的 。 











当 我 们 知道 了 “ 左 值 ”这 个 概念 之 后 ， 我 们 就 能 更 清晰 地 了 解 到 哪些 
表达 式 能 作为 赋值 操作 符 = 的 左 操 作 数 以 及 递增 、 递 减 操作 符 的 操作 
数 ， 而 哪些 则 不 能 


14.5 ”C 语 言 中 表达 式 的 求 值 顺 序 


， 使 得 对 





C 语 言 标准 对 程序 执行 的 语义 做 了 一 种 抽象 机 行为 的 描述 
于 C 语 言 生成 执行 代码 的 优化 可 根据 目 己 的 环境 进行 处 理 。 对 一 个 表达 
式 的 计算 通常 来 说 同时 包括 了 对 值 的 计算 以 及 相应 副作用 的 引发 。 对 一 
个 左 值 表达 式 的 值 计算 包含 了 对 它 所 指派 对 象 的 标识 的 判定 。 


所 谓 次 序 都 是 一 种 相对 关系 。 我 们 说 两 个 表达 式 哪 个 执行 在 前 、 哪 


个 执行 在 后 ， 都 是 针对 这 两 个 表达 式 而 言 的 ， 所 以 这 两 个 表达 式 之 间 就 
存在 一 种 次 序 关系 。C 语 言 中 有 4 种 次 序 关 系 : 执行 在 前 的 次 序 关 系 
(sequenced before) 、 执 行 在 后 的 次 序 关 系 〈sequenced after) 、 无 执 
行 先后 的 次 序 关 系 (unsequenced) 、 不 确定 的 次 序 关 系 

而 当 我 们 要 判定 两 个 表达 式 的 计算 执行 
以 这 个 位 置 点 来 判定 这 两 个 表达 式 的 执行 
先后 次 序 关 系 ， 那 么 这 个 点 束 称 为 顺序 点 (sequence point) 。 如 果 表 达 


式 A 与 表达 式 B 具 有 前 后 次 序 关 系 ， 并 且 A 的 计算 发 生 在 B 的 之 前 ， 那 么 
在 这 个 点 处 ， 与 A 相关 的 计算 








(indeterminately sequenced) 。 


顺序 的 时 候 需 要 一 个 参考 点 ， 








在 这 两 个 表达 式 之 间 束 存在 一 个 顺序 点 ， 
和 副作用 发 生 在 与 B 相 关 的 计算 和 副作用 之 前 。 

1) 执行 在 前 的 次 序 关系 是 在 同一 线程 中 所 执行 的 两 个 计算 之 间 的 
可 传递 的 二 元 关系 ， 它 在 两 个 计算 之 间 导 出 一 个 偏 序 。 给 





一 个 非 对 称 、 





定 两 个 计算 A 和 B， 如 果 A 的 次 序 在 B 之 前 ， 那 么 A 的 执行 应 该 在 B 的 执行 
之 前 发 生 。 比 如 : a=b+c; 这 条 语句 中 有 两 个 计算 ， 一 个 是 对 b+c 的 计 

算 ， 还 有 一 个 是 对 a 的 赋值 计算 。 这 里 显然 是 先 执行 b+c 的 计算 ， 然 后 再 
执行 对 a 的 赋值 计算 ， 因 此 表达 式 b+c 与 表达 式 a 的 关系 为 执行 在 前 的 次 

序 天 系 ， 这 里 的 顺序 点 为 = 操作 符 。 这 意味 者 ， 在 对 a 的 赋值 操作 之 前 ， 

表达 式 b+c 的 值 计 算 必 须 先 被 计算 完成 。 














2) 执行 在 后 的 次 序 关系 则 是 执行 在 前 的 次 序 关 系 的 逆 关 系 。 如 果 
计算 A 的 次 序 在 B 之 后 ， 那 么 A 的 执行 应 该 在 B 的 执行 之 后 发 生 。 比 如 : 
a=b+array[10]; ， 我 们 这 里 仅 观察 b+array[10] 表 达 式 。 这 里 ， 表 达 式 
b+array[10] 的 计算 发 生 在 array[10] 之 后 ， 所 以 对 于 整个 表达 式 而 言 ， 
b+array[10] 的 执行 次 序 在 其 子 表达 式 aray[10] 之 后 ， 并 且 这 里 的 顺序 点 
为 + 操作 符 。 





3) 无 执行 先后 的 次 序 关系 是 指 如 果 计 算 A 的 次 序 既 不 在 B 之 前 发 
生 ， 也 不 在 B 之 后 发 生 。 如 果 两 个 表达 式 的 计算 是 无 执行 先后 的 次 序 关 
系 ， 那 么 这 两 个 表达 式 的 计算 可 以 交错 执行 ， 甚 至 并 行 执行 。 比 如 : 
= (atb) + (c+td) ; 。 这 里 ， 表 达 式 (atb) 与 表达 式 (c+d) 是 无 执 
行 先后 的 次 序 关 系 。 如 果 处 理 器 支持 指令 级 的 并 行 执行 的 话 ， 这 两 条 表 
达 式 可 并 行 执行 。 


[ee 


4) 不 确定 的 次 序 关 系 是 指 在 表达 式 A 与 表达 式 B 之 间 不 能 确定 A 发 
生 在 B 之 前 还 是 之 后 ， 但 A 一 定 要 么 发 生 在 BB 之前， 要么 发 生 在 B 之 后 ， 








两 者 不 可 交错 执行 。 比 如 ， 在 函数 标志 function designator) 与 实 参 的 
计算 之 后 ， 但 在 实际 调用 之 前 存在 一 个 顺序 点 。 在 函数 标志 表达 式 〈 即 
表示 当前 函数 ) 中 的 每 个 计算 (包括 对 其 他 函数 的 调用 ) 如 果 没 有 特别 
指明 是 在 被 调 函数 体 的 执行 之 前 还 是 之 后 执行 ， 那 么 相对 于 被 调 函数 的 
执行 来 说 ， 它 与 这 些 计算 是 不 确定 的 次 序 关 系 。 我 们 下 面 将 通过 代码 清 
单 14-9 来 举 一 个 比较 复杂 的 例子 来 说 明 不 确定 的 次 序 关系 。 


代码 清单 14-9 不 确定 的 次 序 关 系 





#include <stdio.h> 

static int funi(int a, int b) 
puts("funi is called!"); 
return 1; 

static int fun2(int a, int b) 
puts("fun2 is called!"); 
return 2; 

static int fun3(int a, int b) 
puts("fun3 is called!"); 
printf("a + b = %d\n", a + b); 
return 3; 

} 

static int fun4(int a, int b) 
puts("fun 4 is called!"); 


return 0; 


int main(int argc, const char* argv[]) 
// 这 里 声明 了 一 个 指向 int (int，int ) 函 数 指针 的 数组 


int (*pFuncList[])(int, int) = { 
&funi, &fun4, &fun2, &fun3 
}; 


pFuncList[funi(1, 2)](fun2(10, 20), fun3(-2, 10) + fun4(0, 0)); 

















代码 清单 14-9 中 ， 表 达 式 pFuncList[fun1〈1，2) ] 束 作为 一 个 函数 
标志 ， 它 指明 了 即将 调用 的 一 个 函数 。 而 这 里 ， 顺 序 点 就 是 在 对 表达 式 
pFuncList[fun1 (1，2) ] 以 及 fun2 (10，20) 、fun3 〈-2， 
10) +fun4 (0，0) 的 计算 之 后 ， 在 实际 函数 调用 发 生 之 前 那 一 刻 。C 语 
言 标 准 明确 指出 ，fun1、fun2、fun3、fun4 可 以 以 任 一 次 序 进行 调用 ， 
在 Apple LLVM 8.0 编 译 器 实现 中 ， 先 调用 的 是 fun1， 然 后 是 fun2， 再 是 
fun3， 最 后 是 fun4。 为 何 函 数 调 用 之 间 的 顺序 点 是 不 确定 的 ， 而 不 是 无 
执行 次 序 的 呢 ? 其 实 对 于 经 典 的 处 理 器 执行 模型 而 言 ， 一 个 线程 中 处 理 
器 同时 只 能 处 理 一 个 分 文 跳 转 ， 所 以 当前 后 同时 有 两 个 分 文 指令 或 函数 
调用 指令 时 ， 处 理 器 必须 一 个 一 个 执行 ， 而 无 法 同时 执行 ， 因 此 这 里 的 
次 序 关 系 就 是 不 确定 的 次 序 关 系 ， 并 且 此 次 序 关系 可 根据 编译 器 的 优化 
需要 等 上 下 文 环境 来 确定 。 











讲 完 了 执行 次 序 之 后 ， 我 们 再 来 详细 讨论 一 下 C 语 言 中 的 顺序 点。 
下 面 描述 顺序 点 会 存在 的 地 方 。 


1) 在 一 个 函数 调用 中 函数 指派 符 和 实 参 的 计算 与 沙 数 实际 调用 之 
间 《 见 代码 清单 14-9) 。 


2) 以 下 操作 符 的 第 一 个 操作 数 与 第 二 个 操作 数 的 计算 之 间 : 逻辑 
与 C&&) 、 逻 辑 或 (|) 、 过 号 (，) 。 





3) 在 条 件 操作 符 ? : 的 第 一 个 操作 数 与 第 二 个 或 第 三 个 操作 数 的 


计算 之 间 。 比 如 : expr1? expr2: expr3; 表达 式 expr1 与 表达 式 2 或 表达 
式 3 的 计算 之 间 存 在 一 个 顺序 点 。 


4) 在 一 条 完整 声明 符 的 末尾 。 


5) 在 对 一 条 完整 表达 式 的 计算 与 下 一 条 要 被 计算 的 完整 表达 式 之 
间 。 所 谓 完 整 表 达 式 即 为 : 不 作为 一 个 复合 字面 量 一 部 分 的 一 个 初始 化 
需 ; 一 条 表达 式 语句 中 的 表达 式 ; 一 条 选择 语句 〈if 或 switch) 的 控制 
表达 式 ; 一 条 while 或 do 语句 的 控制 表达 式 ， 一 条 for 语 句 的 每 条 可 选 的 
表达 式 ; 一 条 retum 语 句 中 的 可 选 表达 式 。 它 不 作为 一 个 声明 符 中 为 一 
个 表达 式 的 茶 一 部 分 。 








6) 紧 放 在 一 个 库 函 数 返回 之 前 。 
7) 与 每 个 格式 化 的 输入 输出 函数 转换 说 明 符 相关 的 行为 之 后 。 





8) 在 对 一 个 比较 函数 的 每 一 次 调用 之 前 与 之 后 ， 以 及 在 对 一 个 比 
较 函 数 的 任 一 次 调用 与 作为 实 参 传递 的 对 象 传 值 之 间 。 


代码 清单 14-10 描 述 了 顺序 点 的 一 些 例子 以 及 相应 的 执行 顺序 。 
代码 清单 14-10 ”关于 顺序 点 的 一 些 例 子 


#include <stdio.h> 
int main(int argc, const char* argv[]) 
{ 


int a = 10; 
// 在 int a = 10; 这 条 声明 符 之 后 有 一 个 顺序 点 


























int b = 20; 


// 在 表达 式 ++a > 0 与 表达 式 b-- < 10 之 间 有 一 个 顺序 点 

// ++a > 0 的 执行 一 定 在 b- - < 19 中 任 一 子 表达 式 的 扫 行 之 前 执行 完成 。 
// 同时 ， 这 里 if 中 的 完整 表达 式 与 if 下 面 的 printf 函 数 调用 之 间 存 在 顺序 点 
if(++a > 0 && b-- < 100) 


// 对 于 这 条 打印 函数 调用 ， 在 第 一 个 a = %d 的 %d 之 后 有 一 个 顺序 点 ， 
// 使 得 在 打印 出 a = 11 之 后 才能 打印 出 bp = 19 
printf("a = %d, b = %d\n", a, b); 

















































































































// 表达 式 a < b 与 后 面 两 个 表达 式 之 间 有 一 个 顺序 点 ， 
// 表达 式 a < b 一 定 先 执行 完成 ， 然 后 再 执行 第 二 个 或 第 三 个 表达 式 


a=a<b?a+li:a-1; 



























































// 这 里 ， 表 达 式 ++b + 1 与 ++a - 1 之 间 存 在 一 个 顺序 点 ， 
// 并 且 在 ++ b + 1 完成 之 前 ，++a - 1 中 的 任 一 子 表达 式 计算 都 不 能 开始 执行 


a= (++b + 1, ++a - 1); 









































最 后 要 提醒 各 位 的 是 ， 如 果 在 一 条 语句 中 出 现 对 同一 标量 对 象 的 多 
个 无 执行 次 序 关 系 的 修改 ， 那 么 行为 是 未 定义 的 。 代 码 清单 14-11 列 出 
了 这 种 情况 





代码 清单 14-11 对 同一 个 对 象 的 多 个 无 执行 次 序 的 修改 





#include <stdio.h> 
int main(int argc, const char* argv[]) 
int array[] = { 1, 2, 3, 4 }; 
int *p = array; 
int a = 0; 
// 在 这 条 赋值 表达 式 中 ， 作 为 = 操作 符 左 操作 数 的 P[at+] 表 达 式 中 合 有 对 对 象 a 的 修改 ， 
// 而 右 操作 数 表达 式 ++a 也 同时 对 对 象 a 进 行 修 改 ， 那 么 这 将 会 引发 未 定义 行为 


p[a++] = ++a; 



































struct Test 


int x, y; 


}t={0,1}; 


// 这 条 语句 没有 问题 ， 尽 管 这 里 的 ++ 操 作 都 是 针对 同一 个 对 象 t， 但 t 是 一 个 结构 体 ，_ 
// 不 是 一 个 标量 类 型 ， 同 时 ，++ 分 别 对 t 的 x 成 员 与 y 成 员 进行 操作 ， 这 是 两 个 不 同 的 元 素 。 
// 因此 这 条 语句 不 会 发 生 未 定义 行为 

p[++t.X] = ++t.y; 









































另外 ， 还 有 一 个 C 语 言 程序 员 讨论 得 比较 多 的 问题 ， 即 表达 式 





x+++++y; 最 后 产生 一 个 什么 结果 的 问题 。 其 实 ，C 语 言 标准 已 明确 指 
出 : 程序 片段 x+++++y 会 被 解析 为 x+++++y， 这 违反 了 递增 操作 符 的 约 
束 《〈 因 为 x++ 已 经 不 是 一 个 左 值 ， 它 不 能 再 次 作为 ++ 操 作 符 的 操作 

数 ) ， 即 便 x+++++y 这 种 解析 可 能 产生 一 个 正确 的 表达 式 。 这 段 文字 其 
实 很 清楚 地 表明 了 x+++++y 最 终 会 被 解析 成 什么 ， 这 也 是 对 词法 解析 器 
的 一 种 约束 。 而 对 于 x+++++y 表 达 式 来 说 ，x++ 与 ++y 是 两 个 无 次 序 关 系 
的 表达 式 ， 并 且 对 x 和 对 y 的 修改 是 作用 在 两 个 不 同 标量 对 象 上 的 ， 因 此 
本 吴 没 有 什么 问题 。 








14.6 ”C 语 言 中 的 语句 


以 上 描述 的 都 是 与 表达 式 相 关 的 概念 。 这 里 我 们 将 再 简单 介绍 一 下 
C 语 言 中 的 语句 。C 语 言 中 一 共 含 有 6 种 语句 ， 分 别 为 :标签 语句 


(labeled statement) 、 复 合 语句 〈compound statement) 、 表 达 式 语句 





(expression statement) 、 选 择 语 句 〈selection statement) 、 碗 代 语句 
(iteration statement) 、 中 转 语句 〈jump statement) 。 因 为 语句 在 本 书 
前 面 的 各 个 章节 中 都 介绍 得 差不多 了 ， 因 此 我 们 以 代码 清单 14-12 中 的 
内 容 来 对 以 上 6 种 语句 做 个 排 号 入 座 。 





代码 清单 14-12 “C 语 言 中 的 语句 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


// 这 是 一 条 声明 ， 而 不 是 语句 
int a, b; 


// 以 下 两 条 是 表达 式 语句 
a = 10; 
b a*2+ 3; 


// 这 是 一 条 复合 语句 
{ 
// 这 三 条 是 在 一 条 复合 语句 中 的 表达 式 语句 


printf("a = %d, b = %d\n", a, b); 
a++， 








5 ) 


} 


// 这 是 一 条 选择 语句 (从 if 到 } ) ， 
// 其 中 从 { 一 直到 } 是 该 选择 语句 中 的 复合 语句 
if (a > 10) 














puts("Greater than ten!”")， 


// 这 是 一 条 在 选择 语句 中 的 跳 转 语句 
goto HELLO; 














// 这 也 是 一 条 选择 语句 (从 if 一 直到 else 后 面 的 分 号 ) 
if (b > 10) puts("Greater than ten!"); 
else puts("Less than ten!"); 

















// HELLO: a++; 是 一 条 标签 语句 











HELLO: 
at+; // 这 是 一 条 标签 语句 中 的 表达 式 语句 
b++ // 这 条 表达 式 语句 不 属于 标签 语句 中 的 语句 








// 这 是 一 条 选择 语句 


switch (a) 


// case0: puts("zero"); 是 一 条 选择 语句 中 的 标签 语句 











case 0: 
puts("zero");  // 这 是 一 条 标签 语句 中 的 表达 式 语句 
break; // 这 是 一 条 跳 转 语句 ， 并 且 不 属于 标签 语句 中 的 语句 











// 整个 case 12: puts("twelve"); 是 一 条 选择 语句 中 的 标签 语句 
// puts("twelve"); 是 一 条 标签 语句 中 的 表达 式 语句 

case 12: puts("twelve"); 
break; // 这 是 一 条 跳 转 语 句 ， 并 且 不 属于 标签 语句 中 的 语句 


// 从 default 一 直到 } 是 一 条 选择 语句 中 的 标签 语句 
// { break; } 是 一 条 标签 语句 中 的 复合 语句 


















































default: { 
break; // 这 是 一 条 复合 语句 中 的 跳 转 语句 
} 

} 


// 这 是 一 条 和 迭代 语句 ，a- -; “是 和 迭代 语句 中 的 表达 式 语句 


while (a > 0) a--; 


// 从 do 一 直到 分 号 是 一 条 迭代 语句 ， 
// 其 中 从 { 一 直到 } 是 该 迭代 语句 中 的 复合 语句 
do 


{ 
b--; 
} while (b > 0); 


// 这 是 一 条 迭代 语句 ，int i = 9 是 其 中 的 一 条 声明 ， 
// i < 5 以 及 i++ 则 属于 表达 式 ， 

// at+，b++; 是 该 迭代 语句 中 的 表达 式 语句 

for (int i = 0; i < 5; i++) a++ b++; 












































// 从 for 一 直到 } 是 一 条 迭代 语句 
< 5， 






































for (a = 0; a ; a++) 
// 从 if 一 直到 分 号 是 迭代 语句 中 的 选择 语句 
if (a == 3) 


continue;  ”// 这 是 选择 语句 中 的 一 条 跳 转 语句 
b--; // 这 是 迭代 语句 中 的 一 条 表达 式 语句 











} 
; // 这 是 一 条 空 语句 
{} // 这 是 一 条 不 包含 任何 语句 的 复合 语句 ， 注 意 ， 复 合 语句 后 面 无 需 加 分 号 


return 0;  // 这 是 一 条 跳 转 语句 



































14.7 本 章 小 结 





本 章 首 先 对 C 语 言 的 表达 式 做 了 系统 的 介绍 ， 同 时 详细 介绍 了 泛 型 
选择 表达 式 以 及 第 量 表达 式 。 然 后 补 完了 C11 标 准 中 新 引入 的 静态 断言 
语句 。 


之 后 ， 我 们 提 到 了 C 语 言 中 关于 左 值 的 概念 ， 最 后 讲述 了 C 语 言 中 
表达 式 的 求 值 顺序 以 及 顺序 点 等 相关 概念 。 











通过 对 本 章 的 学 习 ， 各 位 能 对 C 语 言 具 体 实 现 中 的 一 些 细节 更 深入 
地 了 解 ， 同 时 也 能 感受 到 C 语 言 标准 所 体现 出 的 灵活 性 ， 而 又 不 缺乏 约 
束 性 。C 语 言 标准 在 茶 种 程度 上 给 了 C 语 言 具 体 实现 可 针对 当前 运行 的 
处 理 占 以 及 操作 系统 环境 做 特定 的 执行 优化 。 





第 15 童 ”函数 调用 约定 与 ABI 


我 们 在 第 1 章 中 提 到 过 ，C 语 言 的 一 大 优点 是 我 们 即便 把 源 代码 编译 
好 ， 打 包 成 库 ， 我 们 在 另 一 个 项 目 中 仍然 可 以 去 连接 静态 库 或 动态 库 中 
的 全 局 外 部 对 象 以 及 全 局 外 部 函数 。 这 样 ， 我 们 就 可 以 将 静态 连接 库 或 
动态 连接 库 作 为 插件 或 中 间 件 交 给 其 他 开发 者 来 使 用 了 。 比 如 像 我 们 所 
使 用 的 标准 库 函 数 都 是 以 静态 库 或 动态 库 的 方式 做 默认 连接 的 。 那 么 这 
里 就 会 存在 一 个 问题 ， 我 在 调用 库 中 外 部 全 局 函数 的 时 候 完 竟 是 如 何 调 
用 成 功 的 呢 ? 毕竟 库 中 的 上 下 文 与 当前 项 目 中 的 上 下 文 可 能 会 不 太一 
样 。 为 了 解决 这 一 问题 ， 很 多 操作 系统 给 出 了 针对 当前 系统 环境 下 的 函 
数 调用 约定 (Function Calling Convention) 。 有 了 函数 调用 约定 ， 我 们 
就 可 以 在 某 个 操作 系统 上 使 用 多 种 不 同 的 C 语 言 编译 器 了 。 尽 管 很 多 C 
语言 编译 器 自 成 一 派 ， 比 如 MSVC 编 译 器 与 GCC 就 完全 不 同 ， 但 只 要 它 
们 都 能 遵守 同一 函数 调用 约定 ， 那 么 生成 出 来 的 目标 文件 也 能 正确 地 相 
互 连 接 。 


























ABI 在 之 前 章节 中 也 有 所 提 及 ， 它 的 英文 全 称 是 Application Binary 
Interface， 即 应 用 二 进 制 接口 。 它 是 在 整个 操作 系统 中 对 二 进 制 接口 规 
范 的 详细 描述 ， 不 仅 包 含 了 函数 调用 约定 ， 而 且 还 规定 了 数据 类 型 的 对 
齐 规则 、 布 局 、 大 小 等 ， 还 规定 了 应 用 程序 如 何 做 系统 调用 ;另外 还 有 
目标 文件 、 程 序 库 的 二 进 制 格式 ， 使 得 路 编译 器 的 连接 成 为 可 能 ， 同 时 











操作 系统 的 加 载 器 也 能 成 功 地 加 载 由 不 同 连接 需 最 终 所 构成 的 可 执行 文 
件 ， 并 进行 执行 。 


由 于 ABI 详 细 规 则 与 各 个 操作 系统 紧密 相关 ， 并 且 规 范本 身 也 不 是 
大 简单， 因此 我 们 下 面 将 主要 简单 介绍 Windows 操 作 系 统 以 及 
Unix/Linux 操 作 系 统 下 的 函数 调用 约定 。 至 于 ABI 的 规范 文档 ， 各 位 可 
以 在 网 上 搜索 到 相关 资料 ， 像 大 部 分 Unix/Linux 系 统 在 64 位 模式 的 x86 处 
理 器 中 所 用 的 ABI 遵 循 的 是 System-V 规 范 ， 各 位 能 够 下 载 到 。 


15.1 Windows 操 作 系 统 环境 下 x86 处 理 器 的 函数 调 
用 约定 


Windows 操 作 系 统 中 一 般 x86 处 理 器 用 得 比较 多 ， 因 此 我 们 这 里 也 
针对 x86 处 理 器 做 详细 描述 。 从 AMD 推 出 了 64 位 处 理 器 开始 起 ，x86 处 
理 器 也 能 支持 64 位 模式 了 。 由 于 32 位 模式 与 64 位 执行 模式 在 寄存 器 使 用 
等 方面 会 有 所 不 同 ， 所 以 操作 系统 为 了 能 更 大 效率 地 支持 64 位 模式 程序 
的 执行 ， 其 函数 调用 约定 也 会 与 32 位 模式 下 的 有 所 不 同 。 下 面 将 分 别 介 
绍 32 位 执行 模式 与 64 位 执行 模式 下 的 Windows 操 作 系 统 中 的 函数 调用 约 
定 。 我 们 一 般 对 Windows 下 MSVC 或 现在 新 引入 的 VS-Clang 编 译 器 所 使 
用 的 ABI 简 称 为 MS-ABI。 以 下 两 节 中 的 代码 既 可 以 用 MSVC 编 译 嚣 构 
建 ， 也 可 以 用 VS-Clang 编 译 占 构建 ， 两 者 都 默认 采用 MS-ABI 的 函数 调 
用 约定 ， 并 且 相 互 兼容 。 





15.1.1 Windows 操 作 系 统 下 32 位 x86 执 行 模式 的 函 
数 调 用 约定 


Windows 系 统 中 ，x86 在 32 位 执行 模式 下 的 函数 调用 约定 有 3 种 : C 
图 数 调用 约定 ， 标 准 调用 约定 ， 快 速 调 用 约定 。 在 所 有 这 3 种 调用 约定 


下 ， 所 有 参数 的 位 宽 都 会 被 扩展 到 32 位 。 比 如 ， 我 们 要 传 一 个 short 类 型 
的 对 象 ， 那 么 在 实际 压 栈 的 时 候 ， 就 会 对 它 进行 带 符 号 扩展 到 32 位 ， 因 
此 在 函数 实现 中 ， 该 形 参 尽管 在 类 型 上 仍然 是 short 类 型 ， 但 获取 数据 的 
时 候 其 实 可 以 用 int 类 型 来 获取 ， 当 然 我 们 不 建议 这 么 做 。 而 对 于 返回 

值 ， 如 果 要 返回 的 对 象 少 于 4 个 字 节 ， 那 么 它 会 被 扩展 到 4 字 节 ， 然 后 放 
入 EAX 寄存 器 中 进行 返回 。 如 果 是 一 个 64 位 数据 或 一 个 8 字 节 的 结构 体 
对 象 ， 那 么 实现 会 将 该 8 字 节 对 象 以 EDX: EAX 寄存 器 对 进行 存放 。 其 
中 ，EDX 寄 存 器 存放 高 4 字 节 ，EAX 存 放 低 4 字 节 。 如 果 要 返回 的 对 象 大 
于 8 字 节 ， 那 么 就 会 将 该 数据 的 起 始 地 址 放 入 EAX 寄存 器 中 ， 然 后 在 函 
数 返回 之 后 通过 EAX 作为 基地 址 将 该 结构 体 对 象 完整 地 拷贝 出 来 。 在 函 
数 实现 中 ， 如 果 我 们 需要 使 用 EBX、ESI、EDI 以 及 EBP 寄 存 器 的 话 ， 那 
么 需要 先 将 它们 压 栈 保护 ， 等 函数 返回 之 前 则 推出 堆栈 恢复 之 前 的 值 。 














在 默认 情况 下 ， 如 果 我 们 不 指明 ， 在 C 语 言 中 用 的 束 是 C 函 数 调 用 
约定 了 。 我 们 下 面 来 分 别 介绍 这 三 种 调用 约定 。 


C 函 数 调 用 约定 参照 了 C 语 言 函 数 具 有 不 定 参 数 个 数 的 函数 声明 特 
性 ， 所 以 该 调用 约定 是 将 传递 给 函数 的 参数 全 都 压 入 栈 中 ， 并 且 以 从 石 
到 左 的 顺序 依次 将 参数 压 入 栈 中 ， 也 就 是 说 最 后 一 个 参数 先 压 入 栈 中 ， 
第 一 个 参数 最 后 被 压 入 栈 中 。 在 MSVC 编 译 器 中 ， 默 认 使 用 C 函 数 调 











用 ， 如 有 果 我 们 要 显 式 地 指明 遵循 C 函 数 调用 约定 的 函数 时 ， 我 们 可 以 对 
该 函数 用 _cdecl 调 用 约定 限定 符 进 行 修 饰 ， 此 关键 字 是 MSVC 纺 译 器 对 





标准 C 语 言 的 扩展 ， 不 属于 标准 C 语 言 的 范 畴 。 采 用 C 函 数 调 用 约定 时 ， 
函数 调用 者 负责 将 压 入 堆栈 的 实 参 清除 挥 ， 即 把 栈 指 针 恢 复 到 传 参 之 前 
的 位 置 。 


当 需 要 指定 一 个 函数 做 标准 调用 约定 时 ， 我 们 在 声明 函数 的 时 候 使 
用 _stdcall 调 用 约定 限定 符 对 该 函数 标识 符 进行 修饰 。 标 准 函 数 调 用 约 
定 的 参数 传递 与 C 调 用 约定 类 似 ， 在 参数 传递 上 也 是 将 参数 全 都 压 入 栈 
中 ， 不 过 有 所 区 别 的 是 ， 标 准 调用 约定 是 由 函数 实现 自己 清理 传 入 函数 
的 形 参 所 占 的 栈 空间 。 由 于 x86 中 的 RET 函 数 返 回 指令 可 直接 带 操作 
数 ， 指 示 将 栈 指针 往 上 加 多 少 字 节 ， 使 得 栈 指针 在 函数 返回 的 同时 就 能 
立即 恢复 到 传 参 之 前 的 位 置 ， 这 也 会 节省 一 部 分 运行 时 开销 。 


当 我 们 需要 指定 一 个 函数 做 快速 调用 约定 时 ， 我 们 在 声明 函数 的 时 
候 使 用 _ fastcall 调 用 约定 限定 符 。 快 速 调用 约定 是 先 尝试 将 前 两 个 参数 
依次 放 入 ECX 寄 存 器 与 EDX 寄 存 器 (如 果 前 两 个 参数 的 字 节 长 度 小 于 每 
于 4) ， 然 后 将 其 余 参 数 仍 然 按 照 从 右 到 左 的 次 序 压 入 堆栈 。 快 速 调用 
与 _stdcall 调 用 约定 一 样 ， 当 函数 返回 之 前 ， 函 数 实现 必须 自己 将 之 前 
传 入 参数 所 占用 的 栈 空间 做 清除 操作 ， 而 不 是 给 函数 调用 者 去 做 。 





下 面 我 们 将 为 大 家 介绍 如 何 通 过 Visual Studio 2017 Community 来 实 
验 函 数 调用 约定 。 首 先 ， 我 们 根据 第 3 章 提 到 的 内 容 ， 创 建 一 个 Win32 
控制 台 的 空 项 目 ， 项 目 名 为 demo。 然 后 在 该 项 目 工程 中 新 建 main.c 和 
func.asm 两 个 源 文件 。 新 建 func.asm 时 ， 我 们 也 是 选择 “C++ 源 文件 ”"， 然 





后 对 源 文件 名 命名 为 func.asm 即 可 。 下 面 我 们 要 对 项 目 本 身 进行 设置 ， 
使 得 它 能 支持 汇编 语言 的 编译 和 连接 。 我 们 鼠标 右键 点 击 cdemo 项 目 

名 ， 然 后 在 下 拉 栏 中 找到 “生成 依赖 项 *， 然 后 点 击 “ 生 成 自 定义 ”， 如 图 
15-1 所 示 。 


| rr 








cdemo 


查看 (W) 
分 析 亿 ) 


仅 用 于 项 目 ()) 
限定 为 此 范围 (S) 
] 新 建 解 决 方案 资源 管理 器 视图 (N) 
生成 依赖 项 (B) 
添加 (D) 
虚 。 类 向 导 (D).… Ctrl+Shift+X 














图 15-1 设置 编译 汇编 源 文 件 第 一 步 





然后 我 们 会 看 到 一 个 设置 “生成 自 定 义 项 文件 ”的 对 话 框 ， 我 们 勾 选 
上 “masm” 即 可 ， 如 图 15-2 所 示 。 


Visual C++ 生成 自 定 义 文件 


可 用 的 生成 自 定义 项 文件 (A): 

名 称 路 径 

口 ] ImageContentTask(.targets, .... $(VCTargetsPath)\BuildCustomizations\ImageContentTask.ta 
DD lc(.targets, .props) $(VCTargetsPath)\BuildCustomizations\|c.targets 


MI masm(.targets, .props) $(VCTargetsPath)\BuildCustomizations\masm.targets 
| | MeshContentTask(.targets, .... ${(VCTargetsPath)\BuildCustomizations\MeshContentTask.tard 


口 ShaderGraphContentTask(.ta... $(VCTargetsPath)\BuildCustomizations\ShaderGraphContent 





图 15-2 ”设置 编译 汇编 源 文 件 第 二 步 
下 面 我 们 先 看 看 main.c 源 文件 中 的 内 容 ， 见 代码 清单 15-1。 


代码 清单 15-1 MSVC 在 x86 处 理 器 32 位 环境 下 的 函数 调用 约定 C 源 
文件 





#include <stdio.h> 
#include <stdint.h> 
#include <stdbool.h> 


// 计算 (a - b) 


extern int _ cdecl CFunc(int a, int b); 
extern uint64 t CFunc2(void); 
struct Test 
int a; 
int b; 
int c; 
int d; 
}; 


extern struct Test CFunc3(void); 


// 计算 (a - b) - (c - d) 
extern int __fastcall FastFunc(int a, int b, int c, int d); 


int main(void) 


int value = CFunc(5, 2); 
printf("The C value is: %d\n", value); 


uint64_t llValue = CFunc2(); 
printf("The long value is: Ox%16l]lx\n", llValue); 


value = FastFunc(6, 2, 3, 1); 
printf("The fast value is: %d\n", value); 


Struct Test test = CFunc3(); 
printf("a = %d, b = %d, c = %d, d = %d\n", 
test.a, test.b, test.c, test.d); 





代码 清单 15-1 中 我 们 声明 了 4 个 函数 ， 分 别 是 CFunc1、CFunc2、 
CFunc3 和 FastFunc。CFunc1 用 于 观察 传递 两 个 32 位 整 型 参数 时 ， 采 用 C 
调用 约定 的 参数 传递 情况 ，CFunc2 则 是 用 于 观察 返回 值 为 8 字 节 时 函数 
所 返回 的 情况 ;CFunc3 则 观察 当 返 回 值 是 一 个 较 大 结构 体 对 象 时 ， 函 数 
返回 情况 ，FastFunc 则 是 用 于 观察 调用 一 个 快速 调用 约定 的 函数 时 ， 
它 传 递 4 个 参数 的 情况 。 为 了 便于 观察 ，CFunc1 的 汇编 实现 用 的 是 返回 
第 1 个 参数 减 去 第 2 个 参数 的 结果 ; FastFunc 的 实现 是 先 用 第 1 个 参数 减 去 
第 2 个 参数 结果 ， 再 减 去 第 3 个 参数 与 第 4 个 参数 的 结果 ， 然 后 将 最 终 值 
返回 出 来 。 











下 面 我 们 看 一 下 汇编 源 文件 。 


代码 清单 15-2 MSVC 在 x86 处 理 器 32 位 环境 下 的 函数 调用 约定 汇编 
源 文件 





; 汇编 源 文件 func .asm 





.model flat 
.Code 


_CFunc proc public 


mov eax, [esp + 4] ; EAX 存放 第 一 个 参数 
mov ecx, [esp + 8] ; ECX 存 放 第 二 个 参数 





Sub eax, ecx 
ret 


_CFunc endp 























_CFunc2 proc public 
mov edx, 12345678H ; 存放 高 4 字 节 
mov eax，9gabcdefH ; 存放 低 4 字 节 
ret 

_CFunc2 endp 

_CFunc3 proc public 
push 40 ; 给 成 员 d 赋 值 
push 30 ; 给 成 员 c 赋 值 
push 20 ; 给 成 员 pb 赋 值 
push 10 ; 给 成 员 a 赋 值 
mov eax, esp : 2 指针 赋 给 人 吉 构 体 对 象 的 起 始 地 址 
add esp, 16 ; 将 栈 指针 恢 到 返回 地 址 处 
ret 

_CFunc3 endp 


Q@FastFunc@16 proc public 












































mov eax, ecx ; 获取 第 一 个 参数 值 ， 传 给 EAX 

sub eax, edx : 将 第 一 个 参数 人 与 第 二 个 参数 值 相 减 ， 结 果 再 存 到 EAX 
mov ecx, [esp + 4] ; 读 取 第 三 三 个 参数 ， 存 放 到 ECX 

mov edx，[esp + 8] ; 读 取 第 四 个 参数 ， 存 放 到 EDX 

sub ecx, edx > 将 第 三 个 参数 减 去 第 四 个 参数 的 值 存放 回 ECX 























I 








sub eax, ecx ; 将 第 一 个 差 值 与 第 二 个 差 值 再 相 减 ， 存 放 到 EAX 返 


; 这 里 用 ret 8 是 将 压 栈 的 两 个 参数 在 函数 返回 后 直接 推出 栈 
; 相当 于 : ”ret，; add esp, 8; 
ret 8 










































































Q@FastFunc@16 endp 


end 





通过 代码 清单 15-2， 我 们 看 到 ，CEFunc2 最 终 返 回 
0x12345678_90abcdef。 而 CFunc3 最 终 所 返回 的 结构 体 的 成 员 依 次 是 
10、20、30、40。 我 们 注意 到 ，FastFunc 子 过 程 最 后 用 ret 8 表示 函数 返 
回 后 ，ESP 自 动 加 8， 以 回收 压 入 栈 中 作为 形 参 的 栈 空间 。 


下 面 通 过 图 15-3 来 描述 CFunc1 的 参数 传递 时 栈 空间 的 数据 存放 情 


QD 从 图 15-3a 中 可 以 看 到 ， 一 开始 在 调用 CFunc 之 前 假定 此 时 ESP 栈 
站 针 指 同 0x010C 的 位 置 ， 由 于 当前 栈 指针 所 指 的 栈 空间 地 址 属于 函数 调 
用 者 的 上 下 文 ， 所 以 其 数据 不 用 动 ， 用 X 表 示 。 其 余数 据 用 ? 表示 未 知 
数据 。 





@ 在 调用 CEFuncl 之 前 ， 先 传递 参数 ， 并 且 是 以 从 右 到 左 的 顺序 传 
递 ， 先 传 右边 参数 ， 即 第 二 个 参数 ， 我 们 发 现 此 时 ESP 到 了 0x108 的 位 
置 ， 并 且 0x108 到 0x10B 存 放 的 是 32 位 带 符号 整数 2 〈 见 图 15-3b) 。 


@ 如 图 15-3c 所 示 ， 传 入 左边 参数 ， 即 第 一 个 参数 ， 此 时 栈 指针 ESP 
再 向 下 减 4， 到 了 0x0104 的 位 置 ， 这 里 0x0104 到 0x0107 存 放 的 就 是 第 一 
个 参数 的 数据 ， 即 32 位 带 符 号 整数 5。 





@ 做 CFunc1l 函 数 的 调用 ( 见 图 15-3d) ， 执 行 CALL 指 令 之 后 ， 会 自 
动 将 当前 CALL 指 令 的 下 一 条 指令 的 地 址 压 入 栈 中 ， 此 时 ESP 也 移动 到 
了 0x100 的 位 置 。 因 此 我 们 访问 [ESP+4] 就 是 访问 第 一 个 参数 的 数据 ， 而 
访问 [ESP+8] 就 是 访问 第 二 个 参数 的 数据 。 


CFunc1 函 数 调用 前 栈 指针 的 位 置 


0x010C ESP 
0x0108 


0x0104 





0x0100 


:只 
再 传 入 第 一 个 参数 
0x010C 
Ox0108 


0x0104 ESP 





0x0100 


6 
图 15-3 ”CFuncl 调 用 前 后 的 参数 传递 及 栈 指针 的 变化 


先 传 入 第 二 个 参数 


0x010C 
0x0108 


0x0104 





0x0100 
b) 


0x010C 
0x0108 


0x0104 


0x0100 返回 地 址 ESP 





图 15-4 描 述 了 调用 CFunc3 之 后 ， 结 构 体 成 员 与 栈 的 对 应 关系 以 及 栈 
旨 针 的 变化 ， 最 后 函数 返回 前 后 需要 做 的 工作 。 





CFunc3 函 数 调 用 之 前 调用 CFunc3 函 数 给 局 部 结构 体 对 象 初始 化 ”函数 返回 之 前 恢复 栈 指针 
















































































X X X X 
0x0114 ESP 0x0114 0x0114 Ox0114 
? 返回 地 址 返回 地 址 返回 地 址 
0x0110 0x0110| 返回 地 址 | Esp oxo110 | 返回 地 址 0x0110 | 返 四 地址 | Ecp 
0x010C ? 0x010C 2? ox010C| 40 Ox010C| ”40 
0x0108 ? 0x0108 ? 0x0108 30 0x0108| 30 
0x0104 ? 0x0104 0x0104 20 0x0104| 20 
0x0100 2? 0x0100 2? 0x0100 10 ESP ”0x0100 10 EAX 
. b) 6) d) 


图 15-4 ”CFunc3 函 数 调 用 前 后 栈 数 据 以 及 栈 指针 变化 


QD 由 于 我 们 在 调用 CFunc3 的 时 候 ， 它 没有 参数 ， 所 以 不 需要 先 做 压 
栈 操作 。 我 们 这 里 也 是 用 ?表示 此 时 栈 空间 中 的 数据 见 图 15-4a。 


@) 调 用 CFunc3 之 后 ，x86 处 理 器 会 先 将 当前 CALL 指 令 的 下 一 条 指 
令 的 地 址 压 入 栈 中 ， 然 后 ESP 到 0x0110 的 位 置 〈 见 图 15-4b) 。 


@ 在 CFunc3 内 ， 对 要 返回 的 结构 体 对 象 进行 初始 化 ， 其 成 员 a 到 d 依 
次 被 赋值 为 10、20、30 和 40， 此 时 ESP 会 在 0x0100 的 位 置 ( 见 图 15- 
4c) 。 


由 在 函数 返回 之 前 ， 我 们 先 用 EAX 寄存 器 记录 当前 ESP 的 位 置 ， 这 
样 EAX 就 会 作为 指向 该 结构 体 对 象 的 指针 被 返回 出 去 了 。 








然后 我 们 将 ESP 恢 复 到 之 前 保存 返回 地 址 的 那个 位 置 ， 执 行 返 回 指 
邻 ( 见 图 15-4d) 。 


在 函数 调用 端 ， 编 译 器 实现 将 会 先 获取 返回 出 来 的 EAX 的 值 ， 然 


后 将 EAX 所 指 回 的 结构 体 对 象 拷贝 到 其 栈 上 下 文中 。 





这 个 过 程 是 立即 实现 的 ， 因 为 我 们 在 图 15-4 中 也 看 到 了 ， 返 回 的 结 
构 体 对 象 的 实体 其 实 已 经 被 回收 了 了， 所 以 在 做 其 他 函数 调用 或 需要 使 用 
栈 空间 的 动作 之 前 ， 必 须 将 此 对 象 的 值 给 拷贝 出 来 。 当 然 ， 如 果 我 们 仅 
仅 调 用 CFunc3 函 数 ， 而 不 是 通过 = 赋值 操作 符 将 其 返回 值 赋值 给 调用 者 
的 结构 体 对 象 ， 那 么 CFunc3 中 的 临时 结构 体 对 象 也 不 需要 被 拷贝 出 来 。 





15.1.2 Windows 操 作 系 统 下 64 位 x86 执 行 模 式 的 函 
数 调用 约定 
x86 处 理 器 在 64 位 模式 下 ， 通 用 寄存 器 的 位 宽 不 仅 增加 到 了 64 位 ， 


而 且 可 用 的 通用 寄存 占 的 数量 也 增长 了 1 倍 。 表 15-1 中 列 出 了 x86 处 理 器 
在 32 位 与 64 位 模式 下 所 有 可 作为 通用 目的 计算 使 用 的 寄存 器 。 














表 15-1 x86 处 理 器 在 32 位 与 64 位 执行 模式 下 所 有 可 作为 通用 日 的 寄存 
器 列表 
寄存 器 类 型 32 位 执行 模式 64 位 执行 模式 
于 AL. Bl, OL. DL DIL., Nil BRL. 
er 六 、B 流 、KRE、 DX、 Di 人、B、Sp、 
i EAX. EBX. BCD EDX. EDI, ESI.| EAX. EBX. ECD. EDX.、 BDI ESI、 
i EBP、ESP、R8D - R15D 


尺 A 人 A 闫 RB ROX RDX,、 RDI、 六 Si 
64 位 寄存 器 不 可 用 
RBP、RSP 、R8 - R15 


表 15-1 中 ，SP、ESP 以 及 RSP 是 作为 栈 指针 寄存 器 使 用 ， 一 般 只 能 
用 它 做 栈 指针 操作 ， 而 不 能 做 其 他 通用 目的 用 途 


在 Windows 系 统 的 函数 调用 约定 中 ，x86 处 理 需 在 64 位 模式 下 ， 函 
数 实 现 需 要 自己 保存 RBX、RDI、RSI、RBP、R12、R13、R14 与 R15 这 

通用 目的 寄存 器 ， 如 果 在 当前 函数 中 用 了 这 些 寄存 器 的 话 。 而 其 他 通 
用 目的 寄存 右 都 由 图 数 调 用 者 目 己 维护 。 另 外 ， 所 有 SIMD 寄 存 露 
CMMX、XMM、YMM 与 ZCMM 寄 存 器 ) 也 都 由 函数 调用 者 自己 维护 ， 
函数 实现 直接 使 用 即 可 。 














对 于 参数 传递 ，64 位 模式 下 就 没 32 位 模式 那么 复杂 了 ， 它 只 有 一 种 
调用 方式 。 由 于 有 充足 的 寄存 器 用 来 存放 参数 ， 所 以 MS-ABI 规 定 ，x86 
处 理 堪 在 64 位 模式 下 ， 对 于 前 4 个 整数 参数 ， 依 次 放 入 RCX、RDX、R8 
与 R9 寄 存 器 ; 之 后 的 参数 都 是 以 从 右 到 左 的 次 序 依 次 压 入 栈 中 。 这 里 需 
要 注意 的 是 ， 即 便 前 面 4 个 参数 都 没有 实际 压 入 栈 空间 ， 但 函数 调用 者 
一 般 会 为 它们 保留 对 应 的 在 调用 函数 中 的 栈 位 置 ， 这 样 看 上 去 就 仿佛 这 
些 寄 存 器 也 被 压 入 了 调用 函数 的 栈 空间 一 样 。 因 此 我 们 在 函数 实现 中 要 
访问 第 5 个 参数 ， 其 实 也 需要 将 RSP 栈 指针 加 40 进 行 访问 ， 而 第 6 个 参数 
则 需要 将 RSP 加 48 进 行 访 问 。 图 15-5 展 示 了 将 在 代码 清单 15-3 中 所 声明 
的 函数 MyFunc2 (Cinta，intb，intc，intd，int16 te，int16 tf) 的 函数 
调用 前 后 栈 指针 的 变化 。 

















调用 MyFunc2 之 前 先 将 栈 指针 移 到 仿佛 传递 了 所 有 6 个 参数 之 后 的 位 置 














0x0138 RSP 0x0138 
0x0130 0x0130 
0x0128 0x0128 
0x0120 0x0120 
0x0118 0x0118 
0x0110 0x0110 
0x0108 0x0108 
0x0100 0x0100 
b) 
再 传 第 5、 第 6 个 参数 最 后 调用 MyFunc2 
0x0138 0x0138 
0x0130 第 6 个 参数 moiao| ”9 | 第 6 个 参数 
0x0128 第 5 个 参数 0x0128 型 第 5 个 参数 
0x0120 0x0120 
0x0118 0x0118 
0x0110 0x0110 
0x0108 RSP pe ? 
0x0100 0x0100 国 数 返回 地 址 | RSP 
d) 


图 15-5 “Windows 系 统 64 位 模式 下 调用 MyFunc2 前 后 的 栈 空间 变化 


从 图 15-5 我 们 能 清楚 看 到 ， 当 我 们 调用 MyFunc2 函 数 之 前 ， 函 数 调 


用 者 会 做 不 少 工作 。 先 把 栈 指针 往 下 移 到 正好 能 放 入 6 个 实 参 的 位 置 ， 
随后 将 第 5、 第 6 个 实 参 放 入 到 MyFunc2 栈 空间 相应 的 栈 空间 位 置 作为 其 


形 参 ， 最 后 调用 MyFunc2 函 数 。 








下 面 ， 我 们 在 展示 代码 之 前 先 教 大 家 如 何在 Visual Studio 2017 
Community 下 生成 64 位 程序 的 步骤 。 与 之 前 一 样 创建 一 个 Win32 控 制 台 
应 用 程序 的 空 项 目 。 然 后 右 击 源 文件 文件 来 ， 选 择 新 建 项 ， 新 建 main.c 
与 fanc.asm 两 个 源 文 件 并 添加 到 项 目 工程 中 。 然 后 ， 与 图 15-1 和 图 15-2 
一 样 ， 添 加 MASM 的 编译 选项 。 由 于 asm 文 件 因为 版 本 不 同 ， 可 能 默认 
不 作为 汇编 源 文件 参与 编译 ， 所 以 需要 为 它 添加 编译 项 类 型 。 我 们 先 右 
键 点 击 func.asm， 如 图 15-6 所 示 : 





然后 选择 “属性 ”， 进 入 func.asm 文 件 的 设置 ， 如 图 15-7 所 示 。 


DWE 
G 打开 (O) 
打开 方式 (N).. 
查看 类 图 (V) 
编译 (M) Ctrl+F7 


限定 为 此 范围 (9) 


新 建 解决 方案 资源 管理 圳 视图 (N) 

从 项 目 中 排除 (J) 

莫 切 (T) Ctrl+X 
复制 (Y) Ctrl+C 
移 除 (V) Del 

重 命名 (M) 

尾 性 (R) Alt+Enter 





图 15-6 “右键 点 击 func.asm 























图 15-7 设置 func.asm 的 Ttem Type 


一 开始 ，func.asm 的 “项 类 型 > 是 “不 参与 生成 ?>， 现 在 我 们 点 击 右 边 
的 三 角 箭头 ， 然 后 选中 “Microsoft Macro Assembler”， 这 样 此 文件 能 
MASM 汇 编 器 进行 编译 了 。 











;了 使 该 配置 同时 适用 二 调试 模式 与 发 布 模式 ， 我 们 在 
左上 和 角 选 择 “ 所 有 配置 "， 同 时 注意 当前 的 平台 是 x64， 因 为 我 们 要 测试 
的 程序 是 64 位 应 用 程序 。 如 果 我 们 之 前 没有 设置 当前 活动 平台 为 x64， 
那么 可 以 根据 图 15-8 进 行 设置 。 在 工具 栏 中 “Debug” 那 个 选择 控件 右边 
有 一 个 原本 默认 显示 “x86” 的 选择 框 ， 现 在 将 它 选 择 为 “x64”。 这 个 选择 
框 就 是 用 于 指定 解决 方案 平台 的 。 这 样 我 们 编译 生成 的 应 用 束 是 64 位 应 
用 了 。 





Team Tools Test Window 


- Pb Local 





图 15-8 ”将 解决 方案 平台 设置 为 64 位 模式 ， 以 生成 64 位 应 用 


这 些 设置 完成 之 后 ， 我 们 就 来 看 代码 清单 15-3。 由 于 64 位 模式 下 杨 
数 调用 约定 就 一 种 ， 所 以 这 里 就 列 出 了 两 个 函数 的 例子 ， 分 别 为 


MyFunc1 与 MyFunc2 。 


代码 清单 15-3 Windows 系 统 x86 处 理 64 位 模式 下 的 函数 调用 约定 C 


源 文 件 





// main.c 源 文件 
#include <stdio.h> 
#include <stdint.h> 





// 执行 (a - b) / (c - d) 操 作 
extern int MyFunci(int64 t a, int8_t b, int32 _t c, int16_t d); 





// 执行 (a + b+ c+d)/(e -ff) 操 作 
extern int MyFunc2(int a, int b, int c, int d, int16 t e, int16_t f); 


int main(void) 


int result = MyFunci(12, 4, 3, -1); 
printf("MyFunci division result: %d\n", result); 


result = MyFunc2(10, 20, 30, 40, 70, 60); 
printf("MyFunc2 division result %d\n", result); 


puts("\nProgram completed!"),; 


getchar(); 





代码 清单 15-3 所 列 出 的 代码 很 简单 ， 这 里 不 多 做 介绍 。 不 过 这 里 要 
提醒 各 位 的 是 ， 请 留意 一 下 这 两 个 函数 的 每 个 参数 类 型 ， 后 面 在 汇编 源 
文件 中 会 做 相关 处 理 。Windows 系 统 x86 处 理 64 位 模式 下 的 函数 调用 约 
定 汇 编 源 文 件 如 代码 清单 15-4 所 示 。 该 源 文 件 列 出 了 MyFunc1l 与 
MyFunc2 的 具体 实现 。 








代码 清单 15-4 Windows 系 统 x86 处 理 64 位 模式 下 的 函数 调用 约定 汇 
编 源 文件 








; func.asm 汇 编 源 文件 
.Code 


MyFunc1 proc public 


























; 由 于 第 三 个 参数 是 8 位 整数 ， 第 四 个 参数 是 16 位 整数 ， 因 此 需要 将 它们 做 带 符号 扩展 ， 
; 否则 ， 高 位 可 能 存在 他 于 归 数据 ， 会 影响 后 续 计 算 

moOVvSX rdx, dl 

moVvSXx r9, r9w 
































































































































sub rcx, rdx ; 将 第 一 个 参数 与 第 二 个 参数 相 减 ， 结 果 存 放 到 RCX 寄 存 器 
mov rax, rcx 
xor rdx, rdx ; 将 RDX 寄 存 器 清 零 ， 它 将 作为 被 除数 的 高 64 位 
Sub r8, r9 ; 将 第 三 个 参数 与 第 四 个 参数 相 减 ， 结 果 存 放 到 R8 寄 存 器 作为 除数 
idiv r8 
ret 
MyFunc1 endp 
MyFunc2 proc public 
add rcx, rdx ; 将 第 一 个 参数 与 第 二 个 参数 相 加 ， 结 果 存 入 RCX 寄 存 器 
add r8, r9 ; 将 第 三 个 参数 与 第 四 个 参数 相 加 ， 结 果 存 入 RDX 寄 存 器 
add rcx, r8 ; 将 两 不 求 和 结果 再 次 求 和 ， 结 果 存 入 RCX 寄 存 器 
mov rax, rex ; 将 结果 移入 RAX 寄 存 器 ， 作 为 被 除数 的 低位 部 分 
xor rdx, rdx ; 将 RDX 寄 存 器 清 零 ， 它 将 作为 被 除数 的 高 位 部 分 
mov rcx, [rsp + 40] ; 获取 第 5 个 参数 
mov r8, [rsp + 48] ; 获取 第 6 个 参数 
; 由 于 最 后 两 个 参数 都 是 无 符号 16 位 整数 ， 因 此 将 这 两 个 参数 做 清 零 高 位 扩展 
; 使 得 高 48 位 比特 都 为 9 
movZx rcx, cx 
movzx  r8, r8w 
sub rcx, r8 
idiv rex 
ret 
MyFunc2 endp 


end 





这 里 大 家 可 以 看 到 Windows 系 统 在 x86 人 处 理 器 64 位 模式 下 参数 传递 


情况 。 此 外 ， 压 入 函数 的 参数 也 是 由 函数 调用 者 自己 清理 ， 不 需要 由 函 


数 实现 来 处 理 。 








最 后 笔者 对 于 函数 调用 约定 中 谁 负 责 清理 传 入 参数 的 栈 空 


题 上 发 表 一 些 个 人 看 法 。 各 位 感 兴 趣 的 也 可 以 与 笔者 联系 大 家 
讨 。 尽 管 像 x86 处 理 器 在 32 位 下 的 


函数 实现 负责 清理 传 入 参数 所 占 的 栈 
但 其 实 从 工程 学 角度 来 看 ， 这 十 一 个 不 对 和 


销 。 


stdcall 与 “ fastcall 函 
空间 ， 从 而 会 节省 一 些 i 
尔 行 为 。 


zs 间 这 个 问 


数 调 用 约定 中 由 
运行 时 开 
这 就 相当 于 函数 


调用 者 分 配 的 空间 ， 但 由 函数 实现 去 回收 ， 所 以 在 64 位 模式 的 函数 调用 
约定 中 ， 采 用 的 是 类 似 _ cdecl 函 数 调用 约定 的 做 法 。 此 外 ， 像 Apple 在 
对 象 引用 计数 管理 方面 也 是 做 了 这 么 一 个 规定 : 是 你 分 配 的 惑 由 你 去 释 
放 ; 不 是 由 你 分 配 的 ， 则 不 用 你 去 释放 。 





15.2 ”Unix/Linux 操 作 系 统 环境 下 x86 处 理 器 的 函数 
调用 约定 


Unix/Linux 操 作 系 统 环境 下 ，x86 处 理 器 在 32 位 执行 模式 下 的 C 函 数 
调用 约定 与 Windows 操 作 系统 上 的 相差 不 多 。 只 不 过 在 Unix/Linux 系 统 
上 规定 ， 在 函数 调用 处 ， 栈 指针 所 指 的 栈 空 间 地 址 必须 是 16 字 节 对 齐 
的 。 此 外 ， 对 于 各 种 数据 类 型 的 对 齐 也 做 了 相关 规定 ， 在 32 位 模式 下 ， 
单字 节 整 数 以 1 个 字 节 对 齐 ; 双 字 节 整 数 以 2 个 字 节 对 齐 ; 其 他 所 有 整数 
与 浮 点 类 型 都 是 4 字 节 对 齐 的 ， 除 了 long double 是 16 字 节 对 齐 之 外 。 














在 Unix 系 操作 系统 中 ， 通 常 使 用 GCC 或 Clang 作 为 编译 器 ， 这 些 编 
译 器 也 提供 了 x86 处 理 器 在 32 位 模式 下 的 三 种 函数 调用 约定 ， 只 不 过 函 
数 调用 约定 限定 符 用 的 是 _attribute_ 来 声明 的 〈 在 第 17 章 中 做 详细 介 
绍 ) 。 默 认 的 函数 调用 约定 仍然 是 cdecl， 即 C 函 数 调用 约定 ， 如 果 我 们 
通过 显 式 声明 的 话 ， 可 以 用 诸如 void_attribute ( (cdedl) ) 
foo 〈void) ; 来 声明 。 此 外 ，stdcall 与 fastcall 也 一 样 ， 分 别 通 过 
attribute  ( (stdcall) ) 与 _attribute 〈( (fastcall) ) 来 声明 。 


64 位 执行 模式 下 则 与 Windows 的 完全 不 同 了 。Unix 系 操作 系统 在 
x86 处 理 嚣 64 位 执行 模式 下 遵循 的 是 针对 AMD64 架 构 的 System-V (这 里 
的 V 表 示 罗 马 数字 5， 不 是 英文 字母 ) ABI。 在 64 位 模式 下 ，long 以 及 


long long 类 型 都 是 64 位 的 ， 并 且 它 们 也 要 求 以 8 字 节 对 齐 。 函 数 实现 需 
要 自己 保存 的 通用 目的 寄存 器 有 RBX、RBP、R12、R13、R14、R15， 
其 他 通用 寄存 器 都 由 函数 调用 者 去 维护 。 而 在 函数 调用 上 ，System-V 
ABI 则 能 将 更 多 的 整数 参数 通过 通用 目的 寄存 器 做 参数 传递 ， 从 左 到 右 
依次 放 入 RDI、RSI、RDX、RCX、R8 与 R9。 








下 面 举 一 个 与 代码 清单 15-3 相 同 的 例子 来 看 看 macOS 下 使 用 64 位 执 
行程 序 的 函数 调用 约定 使 用 情况 。 在 macOS 下， 我 们 使 用 Xcode， 用 默 
认 选 项 配置 即 可 ， 十 分 方便 。 我 们 还 是 在 生成 的 工程 中 使 用 main.c 源 文 
件 ， 汇 编 源 文件 用 func.s， 在 GCC 与 Clang 编 译 器 中 ， 汇 编 源 文件 通常 
用 .s 作 为 后 缀 名 的 文件 。 用 Xcode 新 建 汇编 文件 非常 方便 ， 直 接 在 macOS 
一 栏 中 将 滚动 条 拉动 到 最 下 面 找到 Other 一 栏 ， 然 后 选中 “Assembly 
File" 即 可 ， 如 图 15-9 所 示 。 
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图 15-9 ”用 Xcode 新 建 汇编 源 文件 


代码 清单 15-5 给 出 与 15-3 相 应 的 汇编 源 文件 。 





代码 清单 15-5” macOS 下 实现 与 代码 清单 15-4 相 同 效 果 的 汇编 代码 





// func.s 


.text 
.align 4 


.globl _MyFunc1，_MyFunc2 
































_MyFunc1: 
// 将 第 二 个 参数 与 第 四 个 参数 做 带 符号 扩展 
moOVvVSX %si, %rsi 
movsx  %cx, %rcx 
sub %rsi，%rdi // 第 一 个 参数 减 去 第 二 个 参数 ， 差 存 入 RDI 
sub %rcx，%rdx // 第 三 个 参数 减 去 第 四 个 参数 ， 差 存 入 RDX 
mov %rdi，%rax // 将 第 一 个 差 值 放 入 RAX 作 为 被 除数 
mov %rdx, %rcx // 将 第 二 个 差 信 放 入 RCX 作 为 除数 
xor %rdx，%rdx // 清空 RDX 寄 存 器 ， 作 为 被 除数 高 位 
idiv %rCX 


ret 














_MyFunc2: 
add %rsi，%rdi // 将 第 一 个 参数 与 第 二 个 参数 相 加 ， 结 果 存 入 RDI 
add %rcx，%rdx // 将 第 三 个 参数 与 第 四 个 参数 相 加 ， 结 果 存 入 RDX 
add %rdx，%rdi // 将 两 个 求 和 结果 相 加 ， 结 果 存 入 RDI 寄 存 器 

















入 
入 
各 
movzx  %r8w, %r8 // A 
movzx  ”%r9w，%r9  // 无 名 > 展 第 六 参数 
将 第 5 eA 存 入 R8 作 为 除数 


Sub %r9, %r8 // 
mov %rdi, %rax // 将 求 和 结果 放 入 RAX 作 为 被 除数 




















xor %rdx，%rdx // 清空 RDX 寄 存 器 ， 作 为 被 除数 高 位 
idiv %r8 
ret 





在 Linux 环 境 下 (包括 Android 编 译 环境 下 ) ，GAS 汇 编 器 现在 已 经 
不 要 求 C 语 言 的 外 部 函数 符号 在 汇编 代码 中 需要 显 式 加 上 前 导 _ 符 号 ， 汇 
编 器 会 默认 加 上 。 因 此 上 述 汇编 代码 如 果 拿 到 Linux 或 Android 上 编译 的 
话 ， 我 们 必须 将 _MyFunc1 和 _MyFunc2 前 面 的 下 划 线 给 去 掉 。 





15.3 ”ARM 处 理 妖 环境 下 的 函数 调用 约定 


由 于 ARM 处 理 器 由 ARM 官 方 定义 了 其 函数 调用 约定 ， 所 以 对 于 各 
类 和 骨 入 式 系统 以 及 操作 系统 ， 基 本 都 按照 ARM 官 方 制定 的 调用 约定 进 
行 实现 ， 当 然 有 些 系统 会 在 此 基础 上 做 一 些 扩 展 。 尽 管 大 部 分 ARM 处 
理 器 都 是 32 位 的 ， 不 过 现在 ARMv8 架 构 处 理 器 也 有 32 位 执行 模式 与 64 
位 执行 模式 ，ARM 官 方 分 别 将 它们 称 为 AArch32 与 AArch64。 下 面 我 们 
分 别 对 AArch32 与 AArch64 的 函数 调用 约定 进行 介 


15.3.1 AArch32 架 构 环 境 下 的 函数 调用 约定 





在 AArch32 架 构 体 系 下 ，ARM 处 理 器 可 访问 16 个 通用 目的 寄存 器 R0 
一 R15， 其 中 R13 作为 栈 指 针 寄 存 器 〈SP) ，R14 作 为 连接 寄存 器 
(LR) 用 于 存放 函数 返回 地 址 ，R15 作 为 程序 计数 寄存 器 (PC) 。 这 
里 ，R14 通 常 也 能 作为 通用 目的 寄存 器 来 使 用 ， 所 以 我 们 一 般 能 用 R0 一 
R12 以 及 R14 这 14 个 通用 目的 寄存 器 。 这 里 需要 注音 的 是 R9 寄 存 器 ，R9 
寄存 器 在 不 同 环境 所 扮演 的 角色 可 能 会 不 太一 样 。 在 某 些 嵌入 式 平台 
上 ， 如 果 将 代码 编译 为 地 址 无 关 的 〈position-independent) ， 那 么 R9 将 
作为 静态 基地 址 寄存 器 而 使 用 ， 这 时 当 我 们 在 函数 中 要 访问 全 局 数据 对 
象 的 时 候 就 需要 用 R9 加 上 此 数据 对 象 所 在 的 偏 移 来 定位 真正 的 物理 地 




















址 ， 像 ADS1.2、RVCT4.0 这 些 编 译 器 编译 出 来 的 地 址 无 关 的 代码 都 会 将 
R9 作 为 静态 基地 址 寄存 器 使 用 ， 所 以 我 们 不 能 在 代码 中 自己 使 用 R9 寄 

存 器 。 此 外 ，R9 寄 存 器 也 有 可 能 被 用 于 线程 寄存 器 ， 比 如 用 于 访问 C11 
标准 中 的 _Thread local 对象 ， 所 以 各 位 在 使 用 R9 寄 存 器 的 时 候 需要 注意 
各 个 平台 上 的 相关 文档 ， 以 免 误 用 而 引发 程序 异常 、 骨 溃 的 现象 。 在 

iOS、Android 系 统 中 ，R9 和 寄存器 都 没有 特殊 用 途 ， 各 位 可 以 放心 将 它 视 
为 通用 目的 寄存 器 来 使 用 。 








在 AArch32 架 构 环 境 下 ， 需 要 函数 实现 自己 保存 的 寄存 器 有 R4 一 
R11 以 及 R14。R12 寄 存 器 可 用 作 过 程 间 调用 的 共享 寄存 器 。 比 如 ， 我 在 
子 过 程 A 中 需要 传递 一 个 值 给 子 过 程 B 使 用 ， 那 么 可 以 将 这 个 值 保存 在 
R11 中 ， 子 过 程 B 即 可 直接 通过 访问 寄存 器 R11 而 获取 到 。 所 谓 子 过 程 
(Procedure 或 Routine) 就 是 我 们 用 汇编 写 的 函数 实现 ， 它 与 C 函 数 的 区 
别 不 仅仅 是 在 语言 层面 上 ， 而 且 在 实现 上 更 为 灵活 ， 能 自己 制定 各 类 数 
据 的 传递 方式 以 及 跳 转 方式 。C 函 数 所 生成 的 代码 会 有 更 多 的 规定 与 约 
束 。 











在 AArch32 架 构 环 境 下 ， 函 数 调 用 前 的 参数 传递 规则 十: 对 于 前 4 
个 不 超过 32 位 的 整数 参数 ， 从 左 到 右 依次 放 入 R0 一 R3 寄 存 器 ， 后 续 参 
数 根据 特定 环境 从 右 到 左 依次 压 入 栈 中 ， 不 同 环境 对 函 数 调用 前 的 栈 指 
针 地 址 的 对 齐 要 求 可 能 会 不 同 ， 但 一 般 在 类 Unix 系 操作 系统 中 ， 都 要 求 


8 字 节 或 16 字 节 对 齐 。 





下 面 我 们 还 是 以 代码 清单 15-3 的 C 代 码 作为 样本 来 做 AArch32 架 构 
下 iOS 系 统 环境 的 函数 调用 约定 的 测试 。 用 ioOS 来 做 函数 调用 约定 的 测试 
十 分 方便 ， 我 们 用 Xcode 创 建 一 个 iOS 的 Single View Application 项 目 模 
板 ， 然 后 在 工程 里 添加 一 个 func.s 的 汇编 源 文件 即 可 。 在 iOS 项 目 工程 中 
添加 func.s 的 时 候 与 macOS 工 程 类 似 ， 在 iOS 一 栏 里 的 Others 分 类 能 找到 
Assembly File， 选 择 它 ， 然 后 将 文件 名 命名 为 func 即 可 。 随 后 ， 我 们 可 
以 直接 在 ViewController.m 里 做 测试 ， 如 代码 清单 15-6 所 示 。 由 于 
ViewController.m 是 一 个 Objective-C 源 文件 ， 所 以 是 以 .m 作 为 后 级 名 结 
尾 的 ， 但 各 位 不 用 担心 ，Objective-C 完 全 兼容 C 语 言 ， 它 是 货真价实 的 
C 语 言 的 超 类 ， 这 与 C++ 对 C 语 言 做 兼容 还 不 一 样 。 














代码 清单 15-6 iOS 工程 中 的 ViewController.m 源 文件 代码 





// ViewController.m 
// arm_ test 


#import "ViewController.h" 

@interface ViewController () 

Q@end 

XA 

* 由 于 AArch32 架 构 下 ，ARM-A 的 指令 集中 没有 整数 除法 指令 ， 
* 所 以 这 里 我 们 自己 定义 一 个 全 局 外 部 函数 来 定义 一 个 通用 的 除法 函数 
* 


/ 
int MyDivide(int dividend, int divisor) 
{ 





































































































return dividend / divisor,; 


// 执行 (a - b) / (c - d) 操 作 
// size_t 在 32 位 执行 模式 下 是 32 位 ，64 位 执行 模式 下 为 64 位 
extern int MyFunci(size t a, int8_t b, int32 t c, int16_t d); 














// 执行 (a +1 b+ c+d)/ (e - ff) 操作 
extern int MyFunc2(int a, int b, int c, int d, int16 t e, int16_t f); 


@implementation ViewController 


(void)viewDidLoad { 


[super ViewDidLoad ] ; 


int result = MyFunci(12, 4, 3, -1); 
printf("MyFunci1 division result: %d\n", result); 


result = MyFunc2(10, 20, 30, 60, 70, 50); 
printf("MyFunc2 division resSult: %d\n", result); 


Q@end 





由 于 ARM 处 理 器 从 ARMv4 架 构 一 直到 ARMv7-AM 架 构 中 不 包含 整 
数 除 法 指令 ， 只 有 ARMYV7-R 才 包含 ， 所 以 我 这 里 定义 名 为 MyDivision 函 
数 来 做 通用 的 整数 除法 操作 。 下 面 我 们 通过 代码 清单 15-7 来 看 对 应 的 
MyFuncl 与 MyFunc2 的 函数 实现 。 


代码 清单 15-7 ioOS 工 程 中 在 32 位 模式 下 对 MyFunc1 与 MyFunc2 函 数 
的 实现 





// 
// func.s 
// armv7_test 


.text 
.align 4 


.globl _MyFunc1，_MyFunc2 
.globl _MyDivide 


#ifdef _ arm _ 
.arm 


_MyFunc1: 

















// 这 里 压 入 两 个 寄存 器 ， 以 保持 栈 空间 始终 以 8 字 节 对 齐 
push {r4, lr} 












































sub r0，r0，r1i // 将 第 一 个 参数 与 第 二 个 参数 相 减 ， 结 果 放 入 R9 寄 存 器 
sub r1，r2，r3 // 将 第 三 个 参数 与 第 四 个 参数 相 减 ， 结 果 存 入 R1 寄 存 器 
blx _MyDivide ”// 调用 MyDivide 函 数 ， 执 行 除 法 计算 
pop {r4, pc} 

_MyFunc2: 


push {r4, lr} 


add r9，r9，r1 // 将 第 一 个 参数 与 第 二 个 参数 相 加 ， 结 果 放 入 R9 寄 存 器 






























































add r2，r2，r3 // 将 第 二 个 参数 与 第 三 个 参数 相 加 ， 结果 放 入 R2 寄 存 器 
add rg, ro, r2 // 将 两 个 求 和 结果 再 次 相 加 ， 结 果 放 入 R09 寄 存 器 
ldr r4, [sp, #8] // 读 取 第 5 个 参数 放 入 R4 寄 存 器 
ldr r12， [sp，#12] // 读 取 第 6 个 参数 放 入 R12 寄存 器 
sub r1，r4，r12 // 将 第 5 个 参数 与 第 6 个 参数 相 减 ， 结 果 放 入 R1 寄 存 器 
blx _MyDivide ”// 调用 MyDivide 函 数 ， 执 行 除 法 计算 
pop {r4, pc} 
#endif 





从 代码 清单 15-7 中 我 们 可 以 看 到 ，ARM 指 令 集 对 于 这 两 个 函数 的 实 
现 指 令 非常 精简 ， 参 数 传递 机 制 与 x86 的 也 比较 相似 ， 先 将 前 4 个 整数 参 
数 传 入 寄存 器 ， 更 多 的 参数 以 从 右 到 左 的 次 序 压 入 栈 中 。 并 且 压 入 参数 
的 栈 空间 最 后 也 是 由 函数 调用 者 回收 ， 函 数 实现 无 需 关 心 。 





此 外 ， 如 果 各 位 在 Android 系 统 下 试验 的 话 ， 那 么 在 汇编 源 文件 中 
再 要 把 函数 标识 符 的 前 导 下 划 线 _ 给 删除 。 





最 后 提 一 点 ， 如 果 当 前 ARMv7 染 构 处 理 絮 支持 NEON 技 术 的 话 ， 那 
么 在 iOS 系 统 中 如 果 在 函数 实现 中 使 用 了 癌 量 寄 存 器 ， 就 需要 将 Q4~Q7 
这 4 个 回 量 寄存 器 保存 到 栈 中 。 





区 


15.3.2 AArch64 架 构 环 境 下 的 函数 调用 约定 


从 ARMv8 架 构 起 ，ARM 处 理 器 进入 了 64 位 时 代 。ARMv8 架 构 处 理 
髓 与 x86 处 理 堪 类 似 ， 能 同时 支持 32 位 的 ARMV7 架 构 的 指令 集 ， 即 


AArch32 模 式 ， 以 及 64 位 的 指令 集 ， 即 AArch64 模 式 。 在 15.3.1 节 中 已 经 
介绍 了 AArch32 模 式 下 的 函数 调用 约定 ， 这 里 将 介绍 AArch64 架 构 环境 
下 的 函数 调用 约定 。 


在 AArch64 模 式 下 ，ARM 处 理 器 可 用 的 通用 目的 寄存 器 数量 从 16 个 
增加 到 32 个 ， 分 别 为 R0 一 R31。 其 中 原来 AArch32 中 的 PC 寄存 器 已 经 不 
显 式 地 给 出 了 ， 它 作为 系统 隐藏 的 寄存 器 而 不 开放 到 ISA 中 。 这 里 ， 
R31 作 为 栈 指 针 寄 存 器 〈SP) ，R30 作 为 连接 寄存 器 (LR) 以 存放 函数 
返回 地 址 。 这 些 通用 目的 寄存 器 中 ，R19 一 R28 需 要 由 函数 实现 来 保 
存 。 此 外 ，ARMv8 架 构 必 须 支持 SIMD 技 术 ， 因 此 它 也 包含 了 32 个 向 量 
寄存 器 ， 分 别 为 V0~V31。 其 中 ，V8 一 V15 需 要 由 函数 实现 自己 保存 。 








由 于 有 充足 的 通用 目的 寄存 器 ，AArch64 模 式 下 参数 传递 能 让 更 多 
整数 参数 放 入 寄存 器 中 。 其 中 前 8 个 整数 参数 分 别 存 入 R0 一 R7 寄 存 句 ， 
后 续 更 多 参数 才 压 入 栈 中 。 此 外 ，AArch64 中 ， 压 入 参数 的 栈 空 间 也 是 
由 冰 数 调用 者 来 回收 ， 函 数 实现 无 需 关 心 。 


在 iOS 系 统 下 ，R18 寄 存 器 用 于 系统 特殊 功能 使 用 ， 所 以 我 们 在 用 
汇编 目 己 实现 函数 的 时 候 不 能 对 它 进 行使 用 。 





代码 清单 15-8 也 是 根据 代码 清单 15-6 的 Objective-C 源 文件 来 完成 
AArch64 架 构 下 的 函数 实现 。 


代码 清单 15-8 iOS 工 程 中 在 64 位 模式 下 对 MyFunc1 与 MyFunc2 函 数 


的 实现 





// 


// func. 


S 


// armv8_test 


.text 
.align 4 


.globl _MyFunc1，_MyFunc2 


#ifdef 


_MyFunc1: 


sxtb 
sxth 
sub 
sub 
sdiv 


ret 


_MyFunc2: 


sxth 
sxth 
add 
add 
add 


sub 
sdiv 


ret 


#endif 





代码 清单 15-8 与 代码 清单 15-7 可 以 合并 为 一 个 汇编 源 文件 ， 因 为 这 


x1, 
x3, 
x0, 
x2, 
x0, 


x4, 
x5, 
x0, 
x2, 
x0, 


x4, 
x0, 


__arm64 _ 


wi 
w3 

x0, 
x2, 
x0, 


w4 
Ww5 

x0, 
x2, 
x0, 


x4, 
x9， 


XI 
X3 
X2 





带 符号 扩展 第 2 个 参数 

带 符号 扩展 第 4 个 参数 

将 第 1 个 参数 与 第 2 个 参数 相 加 ， 结 果 放 入 X9 寄 存 器 
将 第 2 个 参数 与 第 3 个 参数 相 加 ， 结 果 放 入 X2 寄 存 器 
将 第 1 个 差 值 除 以 第 2 个 差 值 ， 结 果 放 入 X09 






























































带 符 号 扩展 第 5 个 参数 

带 符号 扩展 第 6 个 参数 

将 第 1 个 参数 与 第 2 个 参数 相 加 ， 结 果 存 入 X9 寄 存 器 
将 第 3 个 参数 与 第 4 个 参数 相 加 ， 结 果 存 入 X2 寄 存 器 
将 第 5 个 参数 与 第 6 个 参数 相 减 ， 结 果 存 入 X4 寄 存 器 














里 面 已 经 通 


是 AArch64 模 式 。 
模式 。 对 于 iOS 设 备 ， 从 iPod Touch 6、iPhone 5S 起 ， 
mini 2 起 用 的 都 是 64 位 Apple A 处 理 器 ， 即 从 Apple A7 开 始 的 处 理 器 都 是 
ARMv8 染 构 的 、 文 持 AArch64 执 行 模式 ， 而 之 前 的 处 理 器 都 只 能 用 
AArch32 执 行 模式 。 


过 编译 器 预定 义 的 宏 来 判定 当前 编译 环境 是 AArch32 模 式 还 
_ arm ”表示 AArch32 模 式 ， 





_ arm64 ”表示 AArch64 
iPad Air 与 iPad 


15.4 本 章 小 结 


本 章 描 述 了 在 Windows 操 作 系 统 以 及 Unix 系 操作 系统 下 x86 处 理 器 
与 ARM 处 理 器 的 函数 调用 约定 。 大 部 分 应 用 程序 员 可 能 并 不 需要 关心 
函数 调用 约定 ， 但 是 编译 器 实现 者 、 高 性 能 计算 、 嵌 入 式 系统 等 领域 的 
程序 员 则 需要 关心 。 这 里 面 牵 涉 不 同 编程 语言 、 不 同 编译 器 所 编译 出 的 
二 进 制 兼容 性 问题 ， 另 外 还 有 很 关键 的 是 C 语 言 与 汇编 语言 如 何 相互 调 
用 问题 ， 这 对 于 高 性 能 计算 的 开发 人 员 以 及 骨 入 式 系统 开发 人 员 来 说 就 
显得 格外 重要 了 。 




















本 章 包 含 了 大 量 汇 编 语言 代码 ， 这 里 不 要 求 大 家 能 对 此 深入 研究 多 
少 ， 如 果 各 位 不 从 事 比较 专业 领域 的 开发 的 话 ， 只 需要 了 解 即 可 ， 因 此 
在 示例 代码 中 也 仪 仪 使 用 加 减 乘除 这 些 基本 的 算术 运算 ， 不 涉及 太 多 复 
杂 的 指令 。 不 管 怎 么 说 ， 通 过 对 本 革 的 学 习 ， 各 位 至 少 能 对 函数 调用 过 
程 ， 包 括 如 何 传 参 、 如 何 把 结果 返回 、 栈 指针 在 函数 调用 前 后 是 如 何 移 
动 的 .….. 会 有 更 深刻 的 理解 ， 这 对 于 学 习 C 语 言 本 里 来 说 也 是 很 有 帮助 
的 。 











第 16 章 ”创建 静态 库 与 动态 库 


在 第 15 章 各 位 已 经 了 解 了 C 语 言 函 数 的 ABI。 如 果 杀 些 系 统 具有 相 
互 兼容 的 ABI， 那 么 对 于 兼容 C 语 言 标准 库 的 系统 环境 ， 我 们 可 以 使 用 
相同 的 静态 库 ， 甚 至 是 动态 库 。 静 态 库 与 动态 库 统 称 为 库 文 件 ， 它 们 是 
用 于 提供 给 应 用 程序 连接 所 使 用 的 打包 好 的 一 种 二 进 制 中 间 文 件 。 库 文 
件 是 一 个 较为 完整 的 目标 文件 的 集合 ， 我 们 可 以 在 一 个 系统 环境 中 创建 
一 个 用 于 创建 静态 库 或 动态 库 的 工程 ， 然 后 将 工程 中 的 所 有 源 文件 进行 
编译 、 打 包 输 出 为 静态 库 或 动态 库 文 件 。 


























静态 库 文 件 是 参与 整个 应 用 程序 一 起 连接 的 库 文件 。 根 据 特定 实 
现 ， 静 态 库 可 不 做 符号 连接 ， 也 可 做 部 分 连接 ， 不 过 无 论 是 哪 种 实现 ， 
静态 库 文件 中 允许 存在 未 解决 的 符号 〈unresolved symbol) ， 即 没有 在 
打包 静态 库 的 工程 中 定义 的 某 些 具有 外 部 连接 的 全 局 对 象 和 函数 ， 而 这 
些 具 有 外 部 连接 的 全 局 对 象 和 函数 在 静态 库 中 的 某 处 被 引用 了 。 




















动态 库 与 静态 库 不 同 的 是 : 它 是 在 程序 加 载 时 ， 或 在 运行 时 进行 加 
载 相关 符号 ， 因 此 动态 库 必 须 进 行 完整 的 连接 处 理 。 如 果 我 们 在 一 个 应 
用 程序 中 ， 通 过 在 运行 时 加 载 动态 库 中 特定 的 全 局 函数 或 全 局 对 象 ， 那 
么 我 们 将 通过 当前 系统 环境 特定 的 系统 调用 进行 。 





下 面 ， 我 们 将 分 别针 对 Windows、macOS 以 及 Linux 系 统 来 讲解 在 这 








些 操作 系统 中 如 何 创 建 静态 库 与 动态 库 ， 并 且 如 何 使 用 静态 库 和 动态 
库 。 





16.1 Windows 系 统 下 创建 静态 库 与 动态 库 


由 于 在 Windows 系 统 下 ， 我 们 用 Visual Studio 开 发 工具 更 多 一 些 ， 
所 以 这 里 将 主要 介绍 如 何 通过 Visual Studio 2017 Community 来 创建 静态 
库 与 动态 库 ， 然 后 在 主 应 用 程序 中 使 用 这 些 库 。 各 位 如 果 没 有 2017 版 
本 ， 那 么 使 用 2015、2013 版 也 差不多 。 


16.1.1 Windows 系 统 下 创建 并 使 用 静态 库 


我 们 首先 打开 Visual Studio， 然 后 准备 创建 一 个 win32 控 制 台 应 用 程 
序 ， 如 图 16-1 所 示 。 


4 模板 


二 二 
4 Visual C++ Win32 项 目 


b Cross Platform 


”其 他 项 目 类 型 


未 找到 你 要 查找 的 内 容 ? 
打开 Visual Studio 安装 程序 


b 联机 


staticLibTest 





图 16-1 选择 Win32 控 制 台 应 用 程序 





随后 ， 我 们 填写 项 目 名 为 staticLibTest， 点 击 “* 下 一 步 ? 到 下 一 个 界 
面 。 


在 下 一 个 界面 中 ， 我 们 先 点 击 “ 应 用 程序 设置 ?， 设 置 应 用 属性 。 这 
里 ， 在 “应 用 程序 类 型 ”中 选择 “静态 库 ? 单 选 按钮 ， 表 示 我 们 要 创建 的 是 
一 个 静态 库 工 程 。 在 “附加 选项 ”中 把 所 有 选项 都 取消 ， 如 图 16-2 所 示 。 


应 用 程序 类 型 : 
indows 应 用 程 
应 用 程序 设置 @@ 应 用 程序 他 ) 
〇 控制 台 应 用 程序 加 ) 


CO 〇 DLLO) 


@) 静态 库 (5) 


附加 选项 : 
国 空 项 目 包 ) 
亏 出 符 三 凶 | 


训 ] 预 筷 至 头 忆 ) 


图 16-2 ”创建 静态 库 工 程 





最 后 ， 我 们 点 击 “ 完 成 ”按钮 ， 进 入 工程 主 界 面 。 我 们 在 右 侧 找 
到 * 源 文件 ”文件 严 ， 鼠 标 右 键 点 击 它 ， 然 后 选择 “添加 ”， 再 点 击 “ 新 建 
项 ”， 然 后 我 们 在 磊 侧 选择 “代码 ”， 再 点 击 “C++File" 之 后 ， 在 “名 称 ” 文 
本 框 中 输入 “lib.c"。 最 后 点 击 “ 添 加 ?按钮 。 这 样 我 们 就 能 看 到 一 个 文本 
编辑 框 ， 这 里 就 能 编写 lib.c 源 文件 中 的 C 代 码 了 。 








静态 库 中 的 C 代 码 见 代码 清单 16-1。 


代码 清单 16-1 静态 库 的 C 代 码 


#include <stdio.h> 
// 此 函数 将 在 主 应 用 程序 中 定义 ， 当 前 库 中 不 解决 此 符号 


extern void MainFunction(void); 












































// 在 静态 库 中 定义 了 具有 内 部 连接 的 函数 InnerFunction， 
// 它 对 主 应 用 程序 的 符号 连接 没有 任何 影响 ， 仅 作用 于 静态 库 项 目 中 的 当前 源 文件 
static int InnerFunction(void) 










































































puts("This is a static library inner function!"); 


return 10; 




















// 在 静态 库 中 定义 了 StaticLibTest 具 有 外 部 连接 的 全 局 函数 
void StaticLibTest(int a) 

































































// 调用 了 MainFunction， 即 对 MainFunction 符 号 进行 了 引用 。 
// 因此 必须 在 主 应 用 程序 中 对 MainFunction 进 行 定义 ， 否 则 主 应 用 程序 将 通 不 过 连接 
MainFunction( ); 



























































int b = InnerFunction(); 
printf("value = %d\n", a + b); 





我 们 编写 完 上 述 代 码 之 后 ， 在 沫 单 栏 找到 “生成 2 按钮， 然后 点 击 之 
后 选择 “生成 解决 方案 ”， 这 样 在 我 们 项 目 工 程 文件 夹 的 Debug 目 录 中 束 
会 出 现 staticlibTest.lib 文 件 了 。 


接 下 来 ， 要 创建 主 工 程 目录 了 。 一 开始 与 图 16-1 一 样 ， 选 择 Win32 
控制 台 应 用 程序 。 然 后 在 “应 用 程序 类 型 ”中 ， 选 择 “ 控 制 台 应 用 程序 ”， 
然后 同样 , “附加 选项 ?中 不 选中 任何 选项 。 点 击 “ 完 成 ?按钮 则 创建 好 了 
当前 的 主 应 用 程序 项 目 工程 。 








然后 在 编辑 界面 ， 我 们 仍然 在 “ 源 文件 ”文件 夹 处 鼠标 右键 点 击 一 
下 ， 然 后 选择 “添加 ”， 再 选择 "新建 项 ”， 然 后 创建 一 个 名 为 main.c 的 源 
文件 。 随 后 ， 我 们 把 刚才 得 到 的 staticlibTest.lib 文 件 放 入 当前 工程 中 
main.c 所 在 的 目录 下 。 我 们 回 到 Visual Studio， 再 右 击 “Source Files”， 选 
择 “ 添 加 ”， 然 后 再 选择 “ 现 有 项 ”， 在 弹出 的 文件 选择 对 话 框 中 选中 
staticlibTest.lib， 最 后 点 击 “ 添 加 ”按钮 ， 则 把 staticlibTest.lib 静 态 库 文 件 











也 加 入 到 了 * 源 文件 ”文件 夹 中 了 ， 如 图 16-3 所 示 。 


4 [S| cdemo 
> wa 引用 
by 呈 外 部 依 束 项 
册 头 文件 


器 | 深交 件 


> ++ main.c 
BB staticLibTest.lib 
思 资源 文件 





图 16-3 ”添加 静态 库 文件 


接 下 来 ， 我 们 在 main.c 文 件 中 输入 代码 清单 16-2 中 所 示 的 代码 。 


代码 清单 16-2” 主 程序 源 代码 





#include <stdio.h> 


// 在 主 函 数 中 定义 具有 外 部 连接 的 全 局 函数 MainFunction 


void MainFunction(void) 


























puts("This is a function in main project!"); 














// 在 主 应 用 程序 中 定义 具有 内 部 连接 的 静态 函数 InnerFunction 
static int InnerFunction(void) 


{ 











puts("This is an inner function in main!"); 
return 200 ; 
} 




















// 声明 定义 在 静态 库 中 的 具有 外 部 连接 的 全 局 函数 StaticLibTest 
extern void StaticLibTest(int al)， 























int main(void) 
StaticLibTest(1); 


int a = = INnerFunction(); 
printf("a = %d\n", a); 


getchar(); 











输入 完成 后 ， 这 次 我 们 可 以 点 击 工具 栏 中 的 绿色 小 三 角 按钮 ， 让 编 
译 器 编译 、 连 接 后 直接 运行 。 此 时 连接 器 会 把 main.c 生 成 的 目标 文件 与 
静态 库 staticlibTest.lib 文 件 做 总 和 连接 ， 从 而 解决 所 有 外 部 符号 ， 最 终生 
成 可 执行 文件 。 如 果 代 码 没有 输入 错误 ， 整 个 程序 能 直接 跑 起 来 。 





这 里 我 们 可 以 看 到 ， 在 main.c 源 文件 中 定义 了 静态 库 中 所 引用 到 的 
MainFunction 函 数 。 此 外 ， 在 main 函 数 中 则 调用 了 在 静态 库 中 定义 的 
StaticLibTest 函 数 。 而 静态 库 中 与 nain 中 所 定义 的 InnerFunction 函 数 都 是 
它们 各 自 独 有 的 ， 因 此 相互 之 间 没 有 任何 影响 。 对 静态 库 中 符号 的 连接 
主要 针对 具有 外 部 连接 的 符号 

















16.1.2 Windows 系 统 上 创建 并 使 用 动态 库 





动态 库 又 称 为 动态 连接 库 ， 是 指 应 用 程序 在 启动 前 被 加 载 时 或 在 运 
行 时 加 载 的 连接 库 。 它 的 优点 是 无 需 重 新 连接 所 有 的 库 从 而 重新 生成 新 
的 可 执行 文件 ， 而 是 只 需 亚 换 当 前 功能 模块 对 应 的 动态 连接 库 文件 。 这 








样 分 有 给 最 终 用 户 的 时 候 ， 或 者 更 新 应 用 时 无 需 把 整个 可 执行 文件 全 都 
连接 更 新 一 这， 而 只 需要 提供 修改 过 的 功能 模块 所 对 应 的 动态 连接 库 
件 ， 只 要 当 应 用 程序 局 动 执行 时 即 可 产生 更 新 后 的 效果 。 





在 Windows 系 统 上 ， 我 们 对 于 “补丁 ”这 个 词 已 经 是 耳熟能详 了 ， 而 
应 用 程序 的 “补丁 ”往往 就 是 通过 更 新 动态 库 文件 来 实现 的 ， 而 不 需要 更 
新 可 执行 文件 本 吴 。 下 面 我 们 束 来 介绍 如 何 通 过 Visual Studio 2017 
Community 来 构建 我 们 自己 的 动态 库 文件 。 








首先 ， 我 们 仍然 根据 图 16-1 创 建 一 个 Win32 控 制 台 工程 ， 名 字 为 
dllTest。 然 后 ， 右 击 “ 应 用 程序 设置 "中 ， 在 “应 用 程序 类 型 ”一 栏 选择 
DLL; 在 “附加 选项 ”中 取消 勾 选 其 他 选项 ， 而 勾 选 上 “ 空 项 目 ”， 如 图 16- 
4 所 示 。 





应 用 程序 类 型 : 
应 用 程序 设置 〇 Windows 应 用 程序 他 ) 
O 〇 控制 台 应 用 程序 (0) 


O 基态 订 ls) 


附加 选项 : 
空 项 目 (E) 
国志 出 付 己 忆 ) 
国 | 预 策 璋 头 忆 ) 





图 16-4 ”设置 DIEL 工 程 


这 里 大 家 一 定 要 勾 选 上 “ 空 项 目 ”， 否 则 DLL 项 目 工程 会 自动 导入 一 


些 杂 七 杂 八 的 头 文件 与 资源 文件 ， 使 得 我 们 后 期 构建 的 动态 库 文 件 无 法 
正常 工作 。 


最 后 点 击 “ 完 成 ? 即 可 创建 好 一 个 DLL 工程 项 目 。 这 里 我 们 类 似 地 
在 “ 源 文件 ”文件 夹 中 创建 一 个 名 为 ”dl.c” 的 源 文件 ， 然 后 裔 入 代码 清单 
16-3 所 示 的 代码 内 容 。 








代码 清单 16-3 ”动态 库 代 码 内 容 





#include <stdio.h> 














// 在 Windows 中 使 用 _declspec(dllexport ) 来 指定 
// 当前 的 函数 作为 可 被 动态 加 载 的 外 部 函数 








void _ declspec(dllexport) DLLFunction(int a) 


printf("This is a dll function! a = %d\n", a); 























// 这 个 函数 将 在 主 程序 中 将 以 运行 时 加 载 的 形式 进行 调用 
int __declspec(dllexport) DLLLoadedFunction(void) 
{ 
puts("DLL loaded function is called!"); 
return 100; 


} 





























在 Windows 中 使 用 了 一 个 C 语 言 扩 展 关 键 字 一 一 
_ declspec (dllexport) 函数 说 明 符 来 指明 当前 函数 可 被 动态 加 载 。 
declspec (dllexport) 只 能 用 于 修饰 上 共有 外 部 连接 的 全 局 函数 或 对 象 。 











另外 在 代码 清单 16-3 中 ， 函 数 DLLFunction 将 在 主 程序 加 载 时 被 加 
载 到 程序 内 存 中 ;， 而 函数 DLLLoadedFunction 将 在 运行 时 直接 通 
Windows API 动 态 加 载 到 程序 内 存 中 ， 然 后 通过 函数 指针 做 间接 调用 。 





写 完 上 述 代码 之 后 ， 我 们 同样 在 菜单 栏 找到 * 生 成 按钮， 点 击 之 后 
选择 “生成 解决 方案 *， 这 样 在 我 们 项 目 工程 文件 夹 的 Debug 目 录 中 就 会 
同时 出 现 dllTest.lib 文 件 与 dllTest.dll 文 件 了 。 其 中 ，dllTest.lib 包 含 了 函 
数 实现 本 体 ， 而 dllTest.dl1 存 放 的 是 符号 映射 等 内 容 ， 所 以 两 者 都 需要 添 
加 到 主 程 序 的 工程 中 。Windows 中 ，dH 文 件 就 被 称 为 动态 连接 库 文 件 。 


我 们 回 到 之 前 创建 好 的 main 工 程 ， 将 刚才 构建 得 到 的 dlTestlib 文 件 
放 到 main.c 源 文件 所 在 的 工程 目录 下 ， 然 后 再 将 dllTest.dll 再 复制 粘贴 到 
工程 主 目录 下 的 Debug 目 录 中 ， 与 生成 的 可 执行 文件 放 在 一 起 ， 由 于 可 
执行 文件 后 面 在 加 载 过 程 中 以 及 运行 时 查找 dllTest.dll 文 件 时 会 以 它 所 在 








的 目录 作为 默认 搜索 路 径 ， 这 么 处 理 显 然 更 容易 些 。 随 后 将 之 前 添加 好 
的 staticlibTest.lib 文 件 删 除 ， 将 新 增 的 dllTest.lib 文 件 添加 到 文件 ”文件 
夹 中 ， 如 图 16-5 所 示 。 


J] 解决 方案 "cdemo*(1 个 项 目 ) 
cdemo 
>》 wg 引用 
>》 中 外 部 依赖 项 
出 头 文件 


Bg dllTest.lib 
pb ++ main.c 


时 资源 文件 

















名 称 


国 cdemo.exe 
上 cdemoJilk 
咖 cdemo.pdb 





图 16-5 ”在 main 工 程 中 添加 dllTest.lib 并 将 dllTest.dl 放 在 可 执行 文件 所 在 


目录 


这 里 dllTest.dl] 无 需 添 加 到 工程 中 ， 因 为 它 不 参与 连接 。 随 后 ， 我 们 
修改 main.c 的 内 容 ， 如 代码 清单 16-4 所 示 。 


代码 清单 16-4 。 Windows 动 态 加 载 山 的 main 源 文件 





#include <windows.h> 
#include <stdio.h> 






































// 用 _declspec(dllimport ) 声 明 当 前 函数 是 通过 加 载 器 在 加 载 程序 时 做 动态 库 连 接 的 
extern void _ declspec(dllimport) DLLFunction(int a); 








int main(void) 
































DLLFunction(100);  // 这 里 可 以 直接 调用 加 载 时 载 入 的 DLLFunction 函 数 


// 使 用 Windows API 库 函数 LoadLibrary 动 态 加 载 dL1L1Test .dl11 库 
HMODULE dllLibHandle = LoadLibrary(L"dllTest.d11"); 





















































// 使 用 Windows API 库 函数 GetProcAddress 获 得 动态 库 中 

// DLLLoadedFunction 外 部 函数 符号 

int (*pFunc)(void) = (int(*)(void))GetProcAddress(dllLibHandle, 
"DLLLoadedFunction"); 









































// 通过 函数 指针 间接 调用 DLLLoadedFunction 
int a = pFunc(); 
printf("a = %d\n", a); 


getchar(); 





这 里 由 于 用 到 Windows API， 因 此 引入 了 <windows.h> 系 统 库 文件 。 
_ declspec (dllimport) 说 明 符 用 于 声明 当前 函数 或 对 象 将 在 加 载 时 做 动 
态 连 接 ， 这 样 它 所 对 应 的 符号 能 安全 地 在 当前 代码 中 进行 引用 。 











在 代码 清单 16-4 中 ， 对 DLLEFunction 函 数 调用 以 下 的 部 分 就 是 通过 


Windows API 对 dllTest.dll 的 运行 时 动态 加 载 过 程 了 。GetProcAddress 系 
统 函 数 基于 得 到 的 动态 库 的 句柄 (handle〉 来 获 


取 “DLLLoadedFunction” 符 号 所 在 的 相对 地 址 ， 然 后 赋值 给 一 个 相应 类 
型 的 函数 指针 对 象 ， 最 后 通过 该 函数 指针 做 间接 调用 。 


这 里 大 家 要 注意 的 是 ， 文 件 的 位 置 要 放 对 ， 如 果 程序 找 不 到 dll 文 
件 则 会 报错 。 此 外 ，dll 文 件 可 以 放 在 与 C 源 文件 的 相同 路 径 下 ， 用 于 工 
程 调试 时 进行 加 载 ， 而 在 Debug 目 录 下 与 可 执行 文件 放 在 一 起 的 dl 文件 
用 于 在 Debug 目 录 下 直接 运行 可 执行 文件 时 做 dl 文件 的 加 载 。 








16.2 macOS 系 统 下 创建 静态 库 与 动态 库 


在 macOS 中 ， 我 们 可 以 方便 地 使 用 Xcode 这 一 灵活 强大 的 集成 开发 
环境 来 创建 静态 库 与 动态 库 。Xcode 可 以 在 Mac App Store 免 费 下 载 ， 而 
且 无 需 注 册 开 发 者 账号 即 可 使 用 。 不 过 Apple 开 发 者 账号 申请 起 来 比较 
容易 ， 而 且 也 是 免费 的 ， 直 接 去 http:/developer.apple.com 即 可 。 这 里 用 
的 Xcode 版 本 是 8.2.1， 不 过 对 于 创建 静态 库 与 动态 库 而 言 ， 更 老 、 更 新 
的 版 本 都 差不多 一 样 。 




















在 macOS 系 统 下 ， 静 态 库 的 创建 和 使 用 与 Windows 环 境 下 的 差 不 
多 ， 并 且 在 使 用 时 也 是 需要 加 入 主 工 程 一 同 进行 连接 的 。 而 动态 库 的 使 
用 则 与 Windows 平 台 的 不 太一 样 ， 在 macOS 以 及 其 他 类 Unix 系 统 中 ， 主 
应 用 程序 可 以 直接 在 加 载 时 由 加 载 器 去 动态 加 载 动态 连接 库 中 的 函数 与 
对 象 ， 但 是 需要 指明 动态 连接 库 的 路 径 ， 在 macOS 中 使 用 
DYLD_LIBRARY_PATH 环 境 变 量 去 指定 。 否 则 的 话 ， 加 载 器 会 默认 
找 /usrlocallib/ 路 径 下 的 动态 库 。 动 态 连接 库 中 所 有 具有 外 部 连接 的 全 
局 函数 与 对 象 的 符号 默认 都 是 可 被 动态 连接 的 ， 因 此 不 需要 像 Windows 
里 那样 使 用 _declspec (dllexport) 去 指定 。 如 果 我 们 希望 在 动态 库 中 的 
某 些 符号 不 允许 被 外 部 连接 或 动态 加 载 ， 可 以 使 用 17.14.1 节 中 所 描述 的 
可 见 性 属性 来 指明 当前 符号 的 对 外 可 见 性 。 























第 17 条 








16.2.1 macOS 系 统 下 创建 并 使 用 静态 库 


首先 ， 我 们 打开 Xcode， 然 后 选择 左 侧 的 “Create a New Xcode 
Project”， 出 现 选 择 新 项 目的 模板 对 话 框 。 我 们 在 此 对 话 框 中 ， 在 对 话 
框 上 侧 选 择 “macOS” 一 栏 下 的 “framework&Library” 选 项 区 域 ， 然 后 点 击 
下 面 大 框 里 的 “Library” 图 标 ， 如 图 16-6 所 示 。 
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图 16-6 ”macOS 库 项 目 创建 


然后 ， 我 们 点 击 “Next” 按 钮 到 下 一 步 ， 来 到 项 目 选 项 对 话 框 。 这 里 
可 以 填 上 自己 的 项 目 名 ， 本 demo 用 的 是 “StaticLibTest*"， 下 面 的 组 织 名 
与 组 织 标识 可 以 自己 随便 填写 ， 然 后 “Framework” 可 以 选择 “None (Plain 
C/C++Library) ”， 由 于 我 们 不 需要 建立 基于 Cocoa Framework 的 库 ， 所 
以 这 里 只 要 选 普 通 C 语 言 的 库 即 可 。 下 面 的 “Type”" 选 择 “Static"， 表 示 要 
创建 的 是 静态 库 。 这 个 对 话 框 设 置 完 后 的 效果 如 图 16-7 所 示 。 











Product Name: (staticLibTest 








Organization Name: GreenGames Studio 








Organization Identifier: |com.greengames 





Bundle Identifier com.greengames.StaticLibTest 


Framework: | None (Plain C/C++ Library) 


Type: | Static 





图 16-7 macOS 创 建 静态 库 项 目 


完成 之 后 点 击 “Next” 按 钮 ， 来 到 了 工程 存放 路 径 选 择 对 话 框 ， 这 里 
各 位 选择 将 此 静态 库 工程 存放 到 哪个 文件 目录 下。 选择 完 之 后 点 
击 “Finish” 按 钮 ， 然 后 就 进入 了 静态 库 工 程 的 主 界面 。 这 里 我 们 能 看 到 
红色 的 libStaticLibTesta， 这 个 文件 将 是 我 们 后 面 成 功 构建 后 生成 的 静态 
连接 库 文 件 。 


我 们 首先 设置 项 目 工程 的 编译 选项 ， 点 击 中间 栏 <TARGETS” 下 面 
的 “StaticLibTest"， 然 后 选择 右 侧 栏 的 "Build Settings”， 找 到 “Apple 
LLVM x.y-Language” 这 一 栏 ， 将 “C Language Dialect” 这 一 项 选择 设置 


为 “gnu11”， 如 图 16-8 所 示 。 


口 Resource Tags Build Settings Build Phases Build Rules 








PROJECT Basic 区 Combined Levels 二 | Qr 








StaticLibTest 





TARGETS 了 Apple LLVM 7.1 - Language 
Setting | staticLibTest 


‘char' Type ls Unsigned No 
Allow 'asm', 'inline', 'typeof’ Yesd 


CodeWarrior/MS-Style Inline Assembly Yest 
Compile Sources As According to File Type 六 
Enable Linking With Shared Libraries Yesd 
Enable Trigraphs No 
Generate Floating Point Library Calls No 
Increase Sharing of Precompiled Headers No 
Precompile Prefix Header No 
Prefix Header 

Recognize Built-in Functions Yeso 
Recognize Pascal Strings Yesd 
Short Enumeration Constants No 
Use Standard System Header Directory Searching Yes 立 








图 16-8 Xcode 环境 设置 库 工程 的 编译 选项 


随后 ， 我 们 鼠标 右键 点 击 带 有 蓝 色 图 标的 工程 文 
件 “StaticLibTest”"”， 然 后 选择 “New File”， 这 样 能 看 到 一 个 选择 源 文件 类 
型 的 对 话 框 。 我 们 仍然 在 上 侧 栏 找到 “macOS”， 然 后 点 击 它 下 面 
的 “Source” 选 项 区 域 中 的 “C File”， 如 图 16-9 所 示 。 


然后 点 击 “Next” 按 钮 ， 输 入 C 源 文件 名 ib”*”， 这 里 “.c” 后 级 可 省 ， 默 
认为 .c 后 级 。 最 后 可 以 将 “Also Create a header file” 选 项 给 去 掉 ， 这 里 我 
们 不 需要 创建 一 个 涉 文 件 ， 然 后 点 击 “Next” 按 钮 后 ， 直 接点 
击 “Create” 按 钮 就 在 我 们 的 StaticLibTest 项 目 中 新 建 好 了 lib.c 源 文件 了 。 


™ Ml products 
例 libstaticLibTest.a 








mN mm 
加 四 


Ul Test Case Unit Test Case 
Class Class 


m | ic 


Objective-C File Header File CeFile 





图 16-9 Xcode 新 建 C 源 文件 


我 们 对 ]ib.c 进 行 编辑 ， 直 接 将 代码 清单 16-1 中 的 内 容 复 制 粘贴 进 
去 。 完 成 之 后 ， 点 击 菜单 栏 上 的 “Product*"”， 再 选择 “Build”， 然 后 我 们 就 
能 看 到 原本 红色 的 libStaticLibTest.a” 变 成 黑色 文字 了 。 此 时 ， 我 们 右键 
点 击 此 "libStaticLibTest.a"， 然 后 选择 “Show in Finder”"”， 这 样 就 能 跳 转 
到 “libStaticLibTest.a” 文 件 所 在 的 目录 了 。 我 们 复制 该 文件 ， 然 后 粘贴 到 
主 应 用 工程 的 目录 下 即 可 。 





下 面 我 们 用 Xcode 创建 主 应 用 工程 。 打 开 Xcode 后 同样 先 选 
择 “Create a New Xcode Project*"， 然 后 在 选择 新 项 目 模 板 的 对 话 框 中 选 
择 “macOS” 一 哆 下 的 “Application” 中 选择 “Command Line Tool*”， 如 图 16- 








10 所 示 。 


然后 点 击 “Next” 按 钮 ， 弹 出 新 建 项 目 选 项 设置 。 这 里 我 们 可 以 将 项 
目 名 设置 为 "Main”， 然 后 “Language” 这 一 栏 选择 “C”， 如 图 16-11 所 示 。 





完成 后 点 击 “Next” 按 钮 ， 出 现 项 目 工程 存放 路 径 的 选择 对 话 框 ， 我 
们 选择 好 之 后 点 击 “Create” 按 钮 就 创建 好 了 主 工程 项 目 。 此 时 ， 在 Main 
文件 夹 下 自动 生成 了 一 个 main.c 的 C 源 文件 。 我 们 鼠标 右键 点 击 main.c 源 
文件 ， 然 后 选择 “Show in Finder”， 跳 转 到 main.c 文 件 所 在 的 目录 。 然 后 
将 刚才 生成 的 "libStaticLibTest.a" 静 态 连 接 库 文 件 拖 进 该 文件 夹 。 完 成 
后 ， 鼠 标 右键 点 击 Xcode 项 目 中 的 “Main” 文 件 夹 (黄色 文件 夹 图 标的 那 
个 ) ， 选 择 “Add Files to Main...”， 选 中 ibStaticLibTest.a”， 然 后 点 
击 “Add” 按 钮 。 这 样 就 把 静态 连接 库 加 入 到 Main 项 目 工 程 中 了 ， 如 图 16- 
12 所 示 。 











图 16-11 用 Xcode 创建 C 项 目 主 工程 


加 Main 
了 “| Main 
了 libStaticLibTest.a 


mainc 
bp 有司 Products 





图 16-12 ”用 Xcode 将 项 态 连接 库 加 入 到 主 项 目 工程 


我 们 像 静 态 库 项 目 设置 那样 设置 主 项 目 工 程 的 编译 选项 ， 将 C 语 言 
标准 选择 为 “gnul11”。 随 后 ， 我 们 将 代码 清单 16-2 中 的 内 容 复 制 粘贴 到 
此 main.c 源 文件 中 。 最 后 ， 我 们 点 击 工具 栏 左 侧 的 黑色 三 角 箭头 就 可 以 
编译 main.c 然 后 连接 静态 库 文 件 ，Xcode 会 自动 执行 生成 好 的 Main 可 执 
行文 件 ， 将 结果 输出 在 下 方 的 输出 框 中 。 











在 Windows 系 统 中 ， 静 态 库 文件 的 后 级 为 “.lib”， 而 在 几乎 所 有 类 
Unix 系 统 中 ， 静 态 库 文件 的 后 缀 全 都 是 “.a”。 


16.2.2 macOS 系 统 下 创建 并 使 用 动态 库 


macOS 系 统 下 创建 动态 库 的 过 程 与 创建 静态 库 十 分 类 似 ， 我 们 在 设 
置 项 目 选项 的 时 候 ， 仅 仅 将 “Type” 选 择 为 "Dynamic” 即 可 。 这 里 我 们 创 
建 一 个 名 为 *DynLibTest” 的 动态 库 项 目 工程 ， 如 网 16-13 所 示 。 








Product Name: DynLibTest 





Organization Name: GreenGames Studio 


Organization Identifier: | com.greengames 


Bundle Identifier: com.greengames.DynLibTest 


Framework: | None (Plain C/C++ Library) 


Type: ， Dynamic 











图 16-13 Xcode 设置 动态 库 项 目 工 程 


我 们 这 里 创建 一 个 名 为 “dylib.c” 的 源 文件 ， 随 后 基本 参考 代码 清单 
16-3 的 内 容 ， 但 这 里 必须 去 掉 _declspec (dllexport) 这 一 说 明 符 。 在 
macOS 以 及 其 他 类 Unix 中 ， 动 态 库 中 所 有 具有 外 部 连接 的 函数 与 对 象 都 
默认 可 被 主 应 用 进行 动态 加 载 。 这 里 ，dylib.c 的 内 容 如 代码 清单 16-5 所 





作 \。 


代码 清单 16-5 ”macOS 环 境 下 的 动态 库 代码 





#include <stdio.h> 


// 以 下 函数 与 对 象 将 在 主 程序 中 以 加 载 时 或 运行 时 进行 加 载 的 方式 做 动态 连接 


int RuntimeLoadedFunction(void) 














puts("DLL loaded function is called!"); 
return 100; 


int dyn_runtime = 20; 








完成 之 后 ， 我 们 点 击 沫 单 栏 中 的 “Product”， 然 后 点 击 “Build” 即 可 完 
成 构建 ， 最 终生 成 ibDynLibTest.dylib” 文 件 。 


我 们 现在 打开 之 前 创建 的 主 应 用 工程 ， 将 之 前 的 静态 库 文件 删除 ， 
然后 与 添加 静态 类 库 类 似 的 方式 将 ibDynLibTest.dylib” 文 件 拷贝 到 此 目 
录 下 。 最 后 ， 我 们 编辑 main.c 源 文件 ， 如 代码 清单 16-6 所 示 。 我 们 先 使 
用 加 载 时 连接 的 方式 。 








代码 清单 16-6 macOSs 在 加 载 程序 时 加 载 动 态 库 符号 的 主 程序 





#include <stdio.h> 
// 声明 动态 库 中 的 RuntimeLoadedFunction 全 局 函数 
extern int RuntimeLoadedFunction(void); 

















// 声明 动态 库 中 的 dyn_runtime 全 局 对 象 
extern int dyn_runtime; 





int main(int argc, const char * argv[]) 


printf("Hello, World!\n"); 











// 调用 动态 库 中 定义 的 RuntimeLoadedFunction 全 局 函数 
int value = RuntimeLoadedFunction(); 
printf("value = %d\n", value); 




















Tt < 























// 调 用 动态 库 中 定义 的 dyn_ runtime 全 局 对 象 
printf("dyn_runtime = %d\n", dyn_runtime); 








return 0; 











当 我 们 编辑 好 代码 清单 16-6 中 的 代码 之 后 ， 点 击 工具 栏 中 的 运行 按 
钮 直接 运行 会 出 现 加 载 时 错误 一 一 在 /usrlocalMlib/ 路 径 中 找 不 到 
libDynLibTest.dylib 文 件 。 此 时 ， 我 们 可 以 打开 控制 台 程序 ， 然 后 进入 到 
libDynLibTest.dylib 文 件 所 在 的 目录 ， 然 后 使 用 export 
DYLD_LIBRARY_PATH= 来 指定 用 户 目 录 下 的 动态 库 路 径 。 随 后 ， 我 
们 进入 可 执行 文件 Main 所 在 的 目录 ， 然 后 直接 运行 。 整 个 过 程 如 图 16- 


14 所 示 。 











| localhost:~ zennychen$ cd /Users/zennychen/Desktop/Main/Main/ 

localhost:Main zennychen$ export DYLD_LIBRARY_ PATH=/Users/zennychen/Desktop/Main/Main 

localhost:Main zennychen$ cd /Users/zénnychen/Library/Developer/Xcode/DerivedData/Main— 
djvwehzvisibujbdqyncbaakgedb/Build/Products/Debug/ 

localhost:Debug zennychen$ ./Main 

Hello, World! 

DLL loaded function is called! 

value = 166 

dyn_runtime = 20 

localhost:Debug zennychen$ 











图 16-14 ”在 控制 台中 动态 加 载 动态 库 文件 并 执行 Main 程 序 


上 面 描述 的 是 在 控制 台中 使 用 加 载 程 序 时 加 载 动态 库 的 方式 来 运行 
主 程序 。 下 面 我 们 将 描述 如 何在 Main 程 序 运行 时 加 载 动态 库 中 的 符号 。 
这 里 我 们 需要 在 做 一 些 准备 。 我 们 在 上 面 原 有 的 Main 工 程 的 基础 上 ， 
要 把 动态 库 文件 添加 到 与 Main 可 执行 文件 的 同一 路 径 中 。 我 们 右 击 
Product 里 的 Main， 然 后 选择 “Show in Finder”， 然 后 系统 会 弹出 当前 
Main 所 在 的 目录 ， 我 们 将 libDynLibTest.dylib 文 件 复制 到 该 目录 下 。 然 
后 在 main.c 源 文件 中 输入 代码 清单 16-7 的 内 容 。 











代码 清单 16-7 ”macOS 使 用 运行 时 加 载 动 态 库 符号 的 主 程序 





#include <stdio.h> 
#include <string.h> 
#include <stdbool.h> 








// 此 头 文件 包含 了 运行 时 动态 加 载 动态 库 中 外 部 符号 的 API 
#include <dlfcn.h> 











// 此 头 文件 包含 了 _NSGetExecutablePath 系 统 API 
#include <mach-o/dyld.h> 
int main(void) 


// 获取 当前 可 执行 程序 所 在 路 径 

char path[512] 

Uint32_t size = sizeof(path); 
_NSGetExecutablePath(path, &size); 


// 将 当前 路 径 与 动态 库 文 件 名 进行 拼接 ， 得 到 动态 库 的 完整 路 径 
strcat(path, "/libDynLibTest.dylib"); 


// 使 用 dlopen 函 数 加 载 动态 库 ， 返 回 动态 库 文件 句柄 
void *dylibHandle = dlopen(path, RTLD_NOW); 















































if(dylibHandle == NULL ) 
{ 


puts("dylib file not found!"); 
return -1; 



































} 
do 
{ | NR 
// 使 用 dlsym 函 数 加 载 外 部 函数 符号 
int (*pFunc)(void) = dlsym(dylibHandle, "RuntimeLoadedFunction"); 
if(pFunc == NULL) 
puts("RuntimeLoadedFunction function not found!"); 
break; 
int a = pFunc(); 
printf("a = %d\n", a); 
// 使 用 dlsym 函 数 加 载 外 部 对 象 符号 
int *p = dlsym(dylibHandle, "dyn_runtime"); 
if(p == NULL) 
puts("dyn_runtime object not found!"); 
break; 
printf("dyn_runtime = %d\n", *p); 
while(false); 
// 关闭 动态 库 文件 句柄 
dlclose(dylibHandle); 





代码 清单 16-7 中 用 到 了 macOS 中 的 一 些 系统 API， 其 中 <dlfcn.h> 系 
统 头 文 件 是 大 部 分 类 Unix 系 统 都 自 融 的 ， 这 其 中 也 包括 Linux， 所 以 在 
大 部 分 类 Unix 系 统 中 我 们 都 能 使 用 dlopen 函 数 来 打开 并 加 载 指定 的 一 个 
动态 库 文件 ， 然 后 用 dlsym 函 数 加 载 该 动态 库 中 指定 的 某 个 函数 或 对 
象 ， 最 后 用 dlclose 关 闭 动态 库 文件 。 而 这 里 的 <mach-o/dyld.h> 是 macOS 
专用 的 ， 它 包含 的 NSGetExecutablePath 函 数 用 于 获取 当前 可 执行 文件 
所 在 的 目录 路 径 。 这 里 各 位 要 注意 的 是 ， 在 macOS 中 ， 如 果 我 们 指 
定 “./XXX” 路 径 并 不 一 定 是 可 执行 文件 当前 路 径 ， 而 是 当前 用 户 的 home 目 
录 路 径 ， 这 一 点 与 Windows 系 统 不 一 样 。 





16.3” Linux 系统 下 创建 并 使 用 静态 库 与 动态 库 


在 Linux 系 统 下 我 们 往往 直接 使 用 命令 行 来 编译 整个 C 语 言 工程 ， 包 
括 打 包 成 静态 库 、 动 态 库 、 生 成 可 执行 文件 等 。 当 然 ， 在 Linux 系 统 下 
我 们 也 可 以 使 用 像 Eclipse 等 集成 开发 环境 (IDE) 进行 开 发 ， 不 过 这 里 
我 们 将 使 用 命令 行 来 描述 。 在 几乎 所 有 类 Unix 系 统 中 ， 藤 态 库 与 动态 庄 
都 用 lib 作 为 文件 名 前 级 。 比 如 ，1libdispatch.a 表 示 一 个 dispatch 静 态 库 文 
件 ; libdispatch.so 表 示 一 个 dispatch 动 态 库 文件 。 后 级 名 .a 就 是 压缩 包 
archive 的 首 字母 ， 后 级 名 .so 是 shared object 的 首 字母 缩写 。 本 书 下 面 所 
描述 的 编译 环境 为 GCC 4.9.0， 运 行 环境 为 CentOS 7.1。 

















16.3.1 Linux 系 统 下 创建 并 使 用 静态 库 文 件 


我 们 首先 在 Linux 环 境 下 用 编辑 器 输入 代码 清单 16-1 中 的 内 容 ， 然 
后 将 文件 保存 为 static_lib.c。 我 们 先 用 以 下 命令 生成 与 之 对 应 的 .o 目 标 文 
人 


gcc -Cc -std=gnu1l11 static lib.c 











完成 之 后 就 会 在 当前 目录 下 生成 static_lib.o 文 件 。 这 里 的 -c 命 令 选项 
就 是 将 源 文 件 编译 为 目标 文件 ， 而 不 做 连接 处 理 。 然 后 我 们 将 此 目标 文 





件 打包 成 静态 库 文 件 : 


ar -cr libstatic lib.a static lib.o 


这 样 ， 在 当前 路 径 中 就 会 出 现 libstatic_lib.a 静 态 库 文 件 。 这 里 的 命 
令 选项 中 c 表 示 创 建 静态 库 文 件 ，r 表 示 如 有 果 当 插入 的 模块 名 已 经 在 库 中 
存在 ， 则 蔡 换 同名 的 模块 。 如 果 我 们 要 对 多 个 目标 文件 打包 ， 那 么 可 以 
再 往 后 添加 目标 文件 名 。 然 后 用 编辑 器 输入 代码 清单 16-2 中 的 内 容 ， 再 
将 文件 保存 为 main.c， 与 之 前 的 static_lib.o 存 放 在 同一 路 径 下 。 做 完 之 
后 ， 我 们 用 以 下 命令 生成 可 执行 文件 test: 





gcc main.c -Std=gnu11 -L./ -lstatic lib -o test 











完成 之 后 就 会 在 当前 目录 中 生成 test 可 执行 文件 。 我 们 直接 用 ./test 
即 可 运行 test 程 序 。 这 里 世 用 于 指定 静态 库 的 搜索 路 径 ， 后 面 跟 ./ 表 示 当 
前 目录 路 径 ，-! 束 是 用 于 连接 静态 库 的 命令 选项 ， 大 家 应 该 注意 到 了 ，- 
] 命 令 后 面 没有 lib 前 级 名 ， 也 没有 .a 后 级 名 ， 而 直接 跟 静 态 库 模块 名 。-o 
命令 选项 用 于 指定 输出 最 终 文件 名 。 





16.3.2 ”Linux 系 统 下 创建 并 使 用 动态 库 


Linux 下 创建 并 使 用 动态 库 的 方式 与 nacOS 系 统 下 差不多 。 我 们 用 
编辑 器 输入 代码 清单 16-5 所 述 内 容 ， 将 它 保 存 为 dynamic.c 源 文件 。 然 后 


我 们 用 以 下 命令 对 它 进 行 编译 ， 生 成 目标 文件 : 





gcc -Std=gnu11 -fPIC -c dynamic.c 











这 条 命令 中 ，-fPIC 选 项 是 将 源 文件 编译 为 位 置 无 关 的 代码 ， 这 对 
于 构成 动态 库 的 目标 文件 而 言 既 能 增强 安全 性 ， 又 能 增强 灵活 性 。 由 于 
macOS 上 的 Xcode 默认 编译 选项 已 经 加 上 了 -fPIC 编译 选项 ， 因 此 我 们 无 
需 手 动 编辑 更 改 。 而 在 Linux 系 统 中 ， 我 们 需要 显 式 指定 ， 默 认 的 选项 
是 位 置 相关 的 。“PIC” 也 就 是 “Position Independant Code” 的 缩写 。 








然后 ， 我 们 用 以 下 命令 创建 动态 库 文件 : 





gcc -shared dynamic.o -0 libdynamic.so 





这 里 的 命令 选项 -shared 就 是 指定 GCC 编 译 器 工具 链 对 输入 的 目标 文 
件 生 成 共享 目标 文件 ， 也 就 是 Linux 下 的 动态 库 文件 。 





Linux 下 使 用 加 载 程序 时 加 载 动态 库 的 方式 与 nacOS 类 似 ， 只 不 过 
我 们 需要 使 用 LD_LIBRARY_PATH 环 境 变量 来 设置 用 户 指定 的 动态 库 
路 径 ， 否 则 加 载 器 默认 使 用 的 是 系统 指定 的 动态 库 路 径 。 我 们 可 以 使 用 
代码 清单 16-6 中 的 代码 来 进行 尝试 ， 这 里 不 再 袭 述 





这 里 ， 我 们 将 举 一 个 使 用 程序 运行 时 加 载 动态 库 的 例子 ， 由 于 运 
加 载 的 方式 与 nacOS 还 稍微 有 些 不 同 。 我 们 把 代码 清单 16-8 的 内 容 输入 


到 main.c 文 件 中 。 








代码 清单 16-8 ”Linux 系 统 下 通过 运行 时 加 载 动态 库 方式 的 主 程 序 





#include <stdio.h> 
#include <string.h> 
#include <stdbool.h> 


// 此 头 文件 包含 了 运行 时 动态 加 载 动态 库 中 外 部 符号 的 API 
#include <dlfcn.h> 


// 此 头 文件 包含 了 readlink 系 统 函 数 ， 用 于 获取 当前 可 执行 文件 的 完整 路 径 
#include <unistd.h> 






































int main(void) 


// 获取 当前 可 执行 程序 所 在 路 径 

char path[512]; 

int size = readlink("/proc/self/exe", path, 512); 

// 由 于 这 里 的 path 得 到 的 是 当前 可 执行 文件 的 完整 路 径 ， 因 此 需要 萃取 出 它 所 在 的 路 径 名 
while(path[--size] != '/' && size > 0); 
path[size] = '\0'，; 


// 将 当前 路 径 与 动态 库 文 件 名 进行 拼接 ， 得 到 动态 库 的 完整 路 径 
strcat(path, "/libdynamic.so"); 














































































































// 使 用 dlopen 函 数 加 载 动态 库 ， 返 回 动态 库 文件 句柄 
void *dylibHandle = dlopen(path, RTLD_NOW); 
if(dylibHandle == NULL) 

{ 


printf("so file not found: %s\n", path); 
return -1; 


// 使 用 dlsym 函 数 加 载 外 部 函数 符号 

int (*pFunc)(void) = dlsym(dylibHandle, "RuntimeLoadedFunction"); 
if(pFunc == NULL) 

{ 


puts("RuntimeLoadedFunction function not found!"); 
break; 


int a = pFunc(); 

printf("a = %d\n", a); 

// 使 用 dlsym 函 数 加 载 外 部 对 象 符号 

int *p = dlsym(dylibHandle, "dyn_runtime"); 
if(p == NULL) 

{ 


puts("dyn_runtime object not found!"); 
break; 


} 
printf("dyn_runtime = %d\n", *p); 


} 
while(false); 


// 关闭 动态 库 文 件 句柄 
dlclose(dylibHandle); 
} 











由 于 Linux 与 macOS 相 比 ， 在 获取 当前 可 执行 文件 所 在 的 路 径 上 有 
些 区 别 ， 因 此 这 里 重新 贴 一 下 完整 代码 ， 而 在 其 他 方面 则 差不多 。 人 然后 
大 家 可 以 用 以 下 命令 来 编译 main.c: 





gcc -Std=gnu11 main.c -0 test -ldl 





这 条 命令 最 终生 成 名 为 test 的 可 执行 文件 。 这 里 ，-ldl 命 令 选项 用 于 
连接 dl 库 。dl 库 包含 了 Linux 系 统 下 对 dlopen、dlsym、dlclose 函 数 的 实 
现 ， 在 默认 情况 下 dl 库 是 不 被 GCC 编 译 器 自动 连接 的 ， 因 此 需要 我 们 显 
式 地 添加 进行 连接 。 


16.4 本章 小 结 








本 章 为 大 家 初步 讲解 了 静态 库 与 动态 库 的 创建 与 使 用 。 在 实际 工程 
项 目 中 ， 我 们 往往 会 涉及 创建 静态 库 与 动态 库 的 需求 ， 而 且 库 对 于 工程 
来 说 也 是 对 功能 模块 的 封 朔 与 抽象 ， 为 其 他 功能 模块 的 开发 者 屏蔽 掉 对 
当前 所 用 模块 的 实现 细节 。 此 外 ， 将 一 些 成 熟 的 代码 打包 成 库 也 能 市 省 
不 少 编译 构建 的 时 间 ， 因 此 打包 成 库 确 实 非常 有 用 。 





























除了 这 些 C 语 言 标准 的 静态 库 与 动态 库 之 外 ， 有 些 系统 平台 还 有 自 
己 特 定 的 库 ， 比 如 macOS 上 有 framework 库 文件 (实质 上 是 一 个 文件 
夹 ) ， 用 于 更 好 地 实现 功能 模块 化 ， 它 主要 用 于 Objective-C 与 Swift 编程 
语言 。 而 像 Java 编 程 语言 也 有 自己 的 JAR 库 文件 等 等 。 另 外 ， 像 Java、 
Python 等 语言 可 以 调用 C 语 言 实 现 的 函数 ， 而 主要 手段 就 是 通过 动态 库 
文件 进行 加 载 ， 然 后 通过 这 些 语言 特定 的 桥接 API 与 C 图 数 进行 交互 。 





第 四 遍 ” 语 法 扩展 篇 












表达 式 中 使 用 复合 语句 
语句 块 作用 域 的 跳 转 标签 


































_Nullable 与 _Nonnull 
语法 扩展 篇 一 一 
使 用 C++11 标 准 的 属性 操作 符 








二 进 制 整数 字面 量 


第 17 音 ”GCC 对 C11 标 准 的 语法 扩展 


从 桌面 系统 一 直到 骸 入 式 系统 ， 现 在 GCC 编译 器 或 遵循 GNU 语 法 
扩展 规范 的 C 语 言 编 译 器 已 经 十 分 普遍 。 在 桌面 系统 端 ， 像 GCC〈 包 括 
使 用 GCC 核心 的 MinGW、Dev-C++ 等 Windows 上 的 编译 器 ) 、Clang 编 
译 器 (包括 Visual Studio 中 集成 的 VS-Clang) 等 都 遵循 GNU 语 法 扩展 。 
当然 ，Clang 编 译 器 自己 还 有 一 些 扩展 ， 另 外 GCC 有 些 特 性 它 也 没有 文 
持 ， 下 一 章 会 讲 到 这 些 情况 。 在 舱 入 式 系统 中 ， 像 用 于 交叉 编译 的 编译 
器 ， 如 ARM-GCC、MIPS-GCC 则 用 得 更 是 普 过 了 ;现在 ARM 官 方 最 新 
推荐 使 用 的 ARM Compiler 6 则 完全 基于 Clang 编 译 器 。 此 外 ， 像 Arduino 
也 是 基于 AVR-GCC 或 ARM-GCC 等 ， 根 据 采用 特定 的 处 理 器 而 定 ， 所 以 
我 们 在 Arduino 集 成 开发 环境 中 也 完全 可 以 使 用 GNU 语 法 扩展 。 而 像 
macOS、iOS 中 所 用 的 Apple LLVM， 以 及 Android 开 发 用 的 NDK 也 都 采 
用 基于 Clang 编 译 器 的 编译 工具 链 。 因 此 ， 我 们 当前 在 绝 大 多 数 场合 均 
可 使 用 更 灵活 、 更 强大 的 GNU 语 法 扩展 。 





由 于 GNU 语 法 扩展 种 类 较 多 ， 并 且 有 些 也 是 由 于 老 的 标准 没有 ， 而 
目 己 加 了 之 后 新 的 C 语 言 标准 又 予以 支持 的 ， 所 以 以 下 介绍 的 GNU 语 法 
扩展 主要 就 是 C11 标 准 所 不 具备 的 ， 但 又 比较 实用 的 ， 有 些 GCC 编 译 絮 
文 持 但 Clang 编 译 吉 不 文 持 的 也 会 妨 作 说 明 。 


为 了 甄别 当前 编译 露 是 否 文 持 GNU 语 法 扩展 ， 我 们 可 以 使 用 
_GNUC_ 这 个 宏 〈 前 后 各 有 两 条 下 划 线 ) 。 代 码 清单 17-1 给 出 一 个 简 
单 的 例子 。 





代码 清单 17-1 鉴别 当前 C 编 译 器 是 否 文 持 GNU 语 法 扩展 





#include <stdio.h> 

#ifdef __GNUC _ 

#warning "This is a GNU compatible compiler!" 
#endif 

int main(void) 


return 9; 


} 





如 果 当 前 编译 器 文 持 GNU 语 法 扩展 ， 那 么 编译 圳 在 编译 时 就 会 发 出 


虹 


全- 
| 





17.1 在 表达 式 中 使 用 复合 语句 与 声明 


在 标准 C 语 言 中 我 们 知道 ， 在 一 条 表达 式 中 只 能 使 用 表达 式 作为 其 
子 表 达 式 ， 而 不 能 使 用 语句 ， 更 不 能 使 用 声明 。 声 明 以 及 其 他 语句 中 可 
包含 一 条 或 多 条 表达 式 。 但 在 GNU 语 法 扩展 中 则 可 通过 使 用 一 个 圆 括号 
将 一 条 复合 语句 包 住 作为 一 条 表达 式 。 在 这 复合 语句 中 当然 还 能 包含 对 
对 象 的 声明 等 其 他 语句 。 








其 语法 形式 为 : (复合 语句 ) 








整个 圆 括号 包 庄 的 复合 语句 表达 式 的 计算 结果 是 由 该 复合 语句 中 最 
后 一 条 语句 的 计算 结果 所 表示 的 。 代 码 清单 17-2 展 示 了 这 种 语法 的 表达 
以 及 效果 。 


代码 清单 17-2 ”表达 式 中 使 用 复合 语句 与 声明 





// main.c 源 文件 
#include <stdio.h> 





int main(void) 
int a = 10, b = 20; 


// 我 们 已 经 知道 ，C 语 言 中 用 { } 包 围 的 一 系列 语句 称 为 一 条 复合 语句 。 
// 这 里 我 们 将 ( ) 包 住 的 复合 语句 作为 = 操作 符 的 右 操 作 数 ， 
// 因此 该 复合 语句 的 最 后 一 条 表达 式 的 计算 结果 必须 是 一 个 int 类 型 


息 三 















































({ 
// 我 们 先 声明 一 个 对 象 X， 并 对 其 初始 化 
intXx=a>b?a+1:b -1 工 ; 

a += Xx; 

b -= x; 

a+b; 


}); 
printf("a = %d, b = %d\n", a, b); 


// 以 下 是 将 复合 语句 表达 式 作 为 for 语 句 中 用 于 初始 化 的 表达 式 的 例子 
for(int i = ({ 

int x=a- b; 

a -= 6; 

x -= 10 * pb， 
}); i < a; i++) 


printf("Hello, world: %d\n", 1); 


























直接 作为 左 值 的 ， 但 可 以 以 引用 的 方式 出 现 ， 








CC 


比 是 不 角 








// 复合 语句 表达 式 也 属于 一 种 表达 式 ， 因 
// 然后 作为 * 间接 操作 符 的 操作 数 来 使 























&a 
}) = 100; 


printf("a = %d\n", a); 





代码 清单 17-2 给 出 了 三 种 复合 语句 表达 式 的 使 用 场景 。 第 一 个 例子 
是 将 复合 语句 表达 式 直 接 用 于 赋值 操作 符 的 场景 。 整 条 复合 语句 表达 式 
的 计算 结果 束 是 最 后 “atb; ”这 条 表达 式 语句 的 值 。 第 二 个 例子 是 将 复 
合 语句 表达 式 用 于 for 语 句 中 对 第 一 条 子 语句 中 临时 变量 的 初始 化 。 第 
三 个 例子 则 直接 通过 复合 语句 表达 式 最 终 所 得 到 的 对 象 a 的 地 址 作为 间 
接 操 作 的 操作 数 进行 访问 。 大 家 在 这 里 就 能 看 到 ， 通 过 在 一 条 复合 语句 
两 边 加 上 左右 圆 括号 就 能 使 它 作 为 一 条 表达 式 来 使 用 ， 这 在 茶 些 场合 还 
是 比较 方便 有 用 的 。 














17.2 ”声明 语句 块 作用 域 的 跳 转 标签 


我 们 在 11.1.2 闻 中 已 经 学 习 到 ，C 语 言 中 的 跳 转 标签 具有 比较 特殊 的 
妆 数 作用 域 ， 也 就 古 说 跳 转 标签 无 论 在 当前 函数 的 哪个 语句 块 中 都 可 
见 。 而 为 了 对 C 语 言 能 有 更 好 的 内 部 模块 封 朔 性 ，GNU 语 法 扩展 中 添加 
了 _label 关键 字 (label 前 后 各 有 两 条 下 划 线 ) ， 用 此 关键 字 声 明 的 标 
签 仅 在 当前 语句 块 作用 域 可 见 ， 因 而 也 被 称 为 局 部 跳 转 标签 。 此 外 ， 在 
其 他 语句 块 作用 域 中 也 可 声明 同名 的 局 部 跳 转 标签 ， 既 不 会 引发 符号 重 
定义 的 冲突 ， 而 且 也 能 正常 跳 转 。 代 码 清单 17-3 展 示 了 局 部 跳 转 标 签 的 
使 用 。 














代码 清单 17-3 ”局 部 跳 转 标签 的 使 用 





#include <stdio.h> 


#define MY_INNER_ PROCESS(a) \ 
_ label MY_JUMP, YOUR_JUMP, FINAL_ PROCESS; \ 
\ 


int b=a- Ss,; 


if(b > 0) 
goto MY_JUMP; 


Se 
goto YOUR_JUMP ， 


Wi 


MY_JUMP : 
printf("b is above zero! b = %d\n", b); \ 
goto FINAL_PROCESS,; 


a 


YOUR_JUMP : 
printf("b is not above zero! b = %d\n", b); \ 


We 


FINAL_PROCESS: 
puts("This is a macro!!"); \ 


int main(void) 


int a = 10; 
if(a > 0) 


// 这 里 声明 a > 0 分支 语 句 块 中 的 局 部 跳 转 标签 
_ label ”MY_JUMP，YOUR_JUMP， FINAL_PROCESS; 























int b=a- 5; 


if(b > 0) 

goto MY_JUMP ， 
else 

goto YOUR_JUMP ， 


MY_JUMP : 
printf("b is above zero! b = %d\n", b); 
goto FINAL_PROCESS,; 


YOUR_JUMP : 
printf("b is not above zero! b = %d\n", b); 


FINAL_PROCESS: 
puts("This is a > 0 path~"); 


else 


{ 
// 这 里 也 同样 声明 a <= 0 分 支 语 句 块 中 的 局 部 跳 转 标 签 ， 
// 且 名 字 与 a > 6 分 支 语句 顽 中 的 完全 相同 
_ label MY_JUMP, YOUR_ JUMP, FINAL_PROCESS ; 
































int b=a+ 5; 


if(b > 0) 

goto MY_JUMP ， 
else 

goto YOUR_JUMP ， 


MY_JUMP : 
printf("b is above zero! b = %d\n", b); 
goto FINAL_PROCESS,; 


YOUR_JUMP : 
printf("b is not above zero! b = %d\n", b); 


FINAL_PROCESS: 
puts("This is a < 0 path!"); 
































// 调用 宏 ， 这 里 MY_INNER_PROCESS 宏 中 也 有 与 上 述 两 个 语句 块 相同 的 跳 转 标签 名 ， 
// 而 结构 也 基本 相同 
MY_INNER_PROCESS(a) ; 





























a= ({ 
_ label MY_JUMP, YOUR_ JUMP, FINAL_PROCESS ; 


int b=a+S5; 
if(b > 0) 

goto MY_JUMP ， 
else 

goto YOUR_JUMP ， 


MY_JUMP : 


printf("b is above zero! b = %d\n", b); 
goto FINAL_PROCESS,; 


YOUR_JUMP : 
printf("b is not above zero! b = %d\n", b); 


FINAL_PROCESS : 


}); 
printf("a = %d\n", a); 





代码 清单 17-3 这 个 代码 示例 详细 说 明了 局 部 跳 转 标 签 的 使 用 与 实际 
效果 。 代 码 清单 17-3 也 是 分 了 3 个 小 例子 。 第 1 个 例子 用 一 个 if-else 条 件 
分 文 设 置 了 两 个 不 同 的 语句 块 ， 在 里 面 声 明了 相同 名 字 的 局 部 跳 转 分 
文 ， 然 后 执行 差不多 功能 的 操作 。 第 2 个 小 例子 是 比较 有 用 的 ， 使 用 宏 
来 封 效 语 句 块 ， 并 且 在 该 语句 块 中 含有 局 部 跳 转 操 作 ， 这 样 束 能 很 清晰 
地 呈现 局 部 跳 转 标签 的 威力 了 : 如 果 没 有 局 部 跳 转 标 签 ， 那 么 宏 定义 中 
的 跳 转 标 俭 将 是 函数 作用 域 的 ， 倘 知 这 个 宏 在 东 个 函数 中 被 使 用 2 次 ， 
那么 就 会 出 现 跳 转 标签 重 定义 的 情况 。 有 了 局 部 跳 转 标签 ， 那 么 宏 也 能 
更 好 地 起 到 封装 抽象 类 似 代码 块 的 作用 。 第 3 个 例子 则 结合 了 上 一 市 我 
们 提 到 的 复合 语句 表达 式 ， 我 们 可 以 看 到 局 部 标签 也 能 在 复合 语句 表达 
式 中 很 好 地 工作 。 








17.3” 跳 转 标 签 作 为 值 


在 标准 C 语 言 中 跳 转 标签 只 能 用 于 goto 语 句 ， 而 无 法 单独 作为 一 个 
表达 式 所 使 用 。 而 在 GNU 语 法 扩展 中 ， 我 们 能 够 通过 && 单 目 操 作 符 取 
跳 转 标签 的 地 址 。 这 里 的 && 不 是 逻辑 与 ， 而 是 用 于 取 跳 转 标签 的 地 址 
的 前 缀 操作 符 ， 要 跳 转 标签 的 地 址 可 用 于 跳 转 到 它 所 指定 的 代码 处 。 正 
是 因为 它 的 计算 结果 是 代码 指令 的 地 址 ， 所 以 不 具有 任何 具体 类 型 ， 在 
GNU 语 法 扩展 中 只 能 用 void* 类 型 表示 &&& 单 目 表 达 式 的 类 型 。 


此 外 ，goto 语 句 的 表达 也 相应 做 了 扩展 ， 除 了 可 直接 跟 跳 转 标签 名 
之 外 ， 还 能 跟 指 同 标签 地 址 的 指针 做 一 次 间接 引用 后 的 表达 式 。 这 一 
非常 有 意思 ， 指 癌 跳 转 标 签 地 址 的 指针 是 void* 类 型 ， 对 它 做 一 次 间接 
操作 后 ， 表 达 式 的 类 型 就 变 为 void 了 。 因 此 ，goto 后 面 跟 的 是 一 个 void 
表达 式 ， 这 也 与 标签 的 类 型 相 吻 合 ， 跳 转 标 签 也 不 具备 任何 实体 类 型 。 


代码 清单 17-4 展 示 了 跳 转 标签 作为 值 使 用 的 方式 。 


代码 清单 17-4 ” 跳 转 标签 作为 值 使 用 





#include <stdio.h> 
#include <stdlib.h> 


int main(void) 








// 声明 一 个 局 部 跳 转 标签 LOCAL_JUMP 
label LOCAL_JUMP; 


// 启明 二 0 并 初始 化 为 指向 函数 作用 域 的 NORMAL_JUMP 标 签 地 址 
void *p = &&NORMAL_JU 














// 声明 一 个 指向 跳 转 标签 的 指针 q， 并 初始 化 为 指向 语句 块 作用 域 的 NORMAL_JUMP 标 签 地 址 
void *q = &&LOCAL_JUMP， 








int a = 10; 
int *buffer = NULL; 


if(a <= 0 


) 
goto *p; // 跳 转 到 指针 p 所 指向 的 标签 





buffer = malloc(sizeof(*buffer) * a); 
if(buffer == NULL) 、 
goto *p; // 跳 转 到 指针 p 所 指向 的 标签 











for(int i = 0; i < a; i++) 
buffer[i] =i+1,; 


if(buffer[0] + buffer[a - 00) 
goto *q; // 避税 到 指针 gq 所 指向 的 标签 


printf("The value is: %d\n", buffer[0] + buffer[a - 1]); 
LOCAL_JUMP: 

printf("buffer[a / 2] = %d\n", buffer[a / 2]); 
NORMAL_JUMP : 


if(buffer != NULL) 
free(buffer ) ， 


puts("Program complete!"); 





有 了 可 取 跳 转 标 签 值 的 能 力 ， 使 得 C 语 言 在 跳 转 上 也 有 了 和 直接 跳 转 
与 间接 跳 转 两 种 方式 ， 这 种 语法 对 称 性 就 与 函数 的 直接 调用 与 通过 指 回 
函数 的 指针 做 间接 调用 一 样 。 除 了 个 别 较 低 级 的 单片机 微 控制 单元 
(MCU) 不 支持 函数 间接 调用 与 地 址 间接 跳 转 之 外 ， 大 部 分 处 理 器 都 
能 直接 在 指令 上 文 持 这 两 种 跳 转 与 函数 调用 方式 。 尽 管 在 goto 语 句 本 喘 
的 使 用 上 ， 有 不 少 程序 员 秉 持 各 目的 意见 和 看 法 ， 但 从 语法 体系 结构 来 
说 ， 能 文 持 这 种 通过 指针 做 间接 跳 转 的 方式 还 是 很 赞 的 。 





17.4。 舰 套 函数 


我 们 在 第 9 章 介绍 函数 的 时 候 已 经 提 到 过 ，C 语 言 标准 规定 我 们 必须 
在 文件 作用 域 定义 一 个 函数 。 然 而 在 GNU 语 法 扩展 中 ， 我 们 可 以 在 一 个 
函数 中 定义 一 个 散 套 函数 (Nested Function) 。 舱 套 函 数 不 具 有 任何 连 
接 ， 如 果 要 在 困 数 内 声明 某 一 般 套 图 数 的 话 ， 可 以 使 用 auto 存 储 类 说 明 
符 ， 表 示 该 函数 无 连接 ， 但 不 能 使 用 extern 或 static 存 储 类 说 明 符 。 藤 套 
函数 可 被 视 为 共享 其 外 部 函数 的 执行 上 下 文 〈 包 括 栈 空 间 ) ， 这 样 使 得 
风 套 函数 可 以 访问 其 外 部 函数 所 声明 的 局 部 对 象 。 骨 套 函数 可 以 通过 函 
数 指针 的 形式 传递 到 外 部 ， 比 如 外 部 函数 的 返回 类 型 是 指向 一 个 函数 的 
虽 针 ， 然 后 将 其 内 部 所 定义 的 内 套 函数 返回 出 去 。 如 果 骨 套 函数 中 没有 
引用 任何 外 部 函数 中 所 声明 的 局 部 对 象 ， 那 么 当 外 部 函数 返回 之 后 ， 通 

函数 指针 来 调用 髓 套 函 数 还 是 安全 的 ;倘若 构 套 函数 引用 了 外 部 函数 
所 声明 的 局 部 对 象 ， 那 么 当 外 部 函数 返回 之 后 ， 其 执行 上 下 文 由 于 被 回 
收 ， 所 以 再 通过 函数 指针 来 间接 调用 其 租 套 函数 ， 可 能 会 引发 运行 时 异 
常 ， 或 是 得 到 意 想 不 到 的 运行 结果 。 代 码 清 单 17-5 列 举 了 骨 套 函数 的 定 
义 与 使 用 ， 并 分 析 其 相关 的 执行 上 下 文 。 











代码 清单 17-5” 髓 套 函 数 的 定义 与 执行 





#include <stdio.h> 
#include <stdint.h> 


/** 

















3 
二 





* Test 函 数 用 于 测试 嵌 套 函数 的 特性 

* @param p 参数 p 用 于 输出 指向 局 部 对 象 i 的 指针 
* @return 返回 指向 嵌 套 函数 的 指针 

yh 

static void (*Test(int **p))(int) 

{ 


















































int i = 10, a = 100; 


// 分 别 输 出 局 部 对 象 i 和 a 的 地 址 
printf("In %s, address of i: Ox%.16tX\n", _ func_ , (uintptr_t)e&i); 
printf("In %s, address of a: Ox%.16tX\n", _ func , (uintptr_t)é&a); 




















// 这 里 定义 Test 函 数 中 的 嵌 套 函数 InnerTest， 
// 它 具 有 一 个 形 参 arg， 这 里 的 类 型 说 明 符 auto 可 省 
auto void InnerTest(int arg) 


{ 
// 这 里 对 外 部 局 部 对 象 的 修改 也 将 会 影响 到 外 部 函数 的 执行 


printf("The value is: %d\n", ++i + arg); 



























































// 这 里 观察 风 套 函数 中 外 部 函数 的 局 部 对 象 i 的 地 址 以 及 典 套 函数 形 参 arg 的 地 址 

printf("In %s, address of i: Ox%.16tX\n", __ func_ , 
(uintptr_t)&i); 

printf("In %s, address of arg: Ox%.16txX\n", _ func_ , 
(uintptr_t)&arg); 





} 


// 调用 骨 套 函数 Innertest 
InnerTest(a); 


// 我 们 这 里 将 会 发 现 i 的 值 加 了 1 
printf("i = %d\n", i); 


// 如 果 形 参 p 不 空 ， 那 么 将 的 地 址 赋值 给 它 
if(p != NULL) 
*p = &i,; 


// 返回 租 套 函数 的 地 址 
return &InnerTest; 


















































} 
static int FetchData(int count) 
{ 


int array[count]; 


for(int i = 0; i < count; i++) 
array[i] =i+1; 


int sum = 0; 


for(int i = 0; i < count; i += 2) 
sum += array[il]; 


// 在 此 函数 中 再 次 调用 Test 函 数 ， 观 察 运行 时 的 执行 情况 
// Test(NULL); 





























return sum; 


int main(void) 


// 声明 指针 对 象 pTrace， 将 用 于 
int *pTrace = NULL,; 


人 














指向 Test 函 数 中 局 部 对 象 1 的 地 址 

















// 声明 函数 指针 pFunc， 直 接 调 用 Test， 
// 将 返回 的 幅 套 函数 为 它 初 始 化 
void (*pFunc)(int) = Test(&pTrace); 










































































// 我 们 这 里 通过 打开 或 屏蔽 FetchData 函 数 中 对 Test 函 数 的 调用 来 观察 执行 状态 
int data = FetchData(100) ， 
printf("data = %d\n", data); 


// 先 输 出 调用 pFunc 之 前 ，Test 函 数 中 局 部 对 象 i 的 值 
printf("Original i = %d\n", *pTrace); 
























































// 如 果 FetchData 函 数 中 执行 了 对 Test 函 数 的 调用 ， 
// 那么 在 这 里 执行 pFunc 的 调用 可 能 会 引起 程序 裔 省 
pFunc(data); 


// 再 输出 调用 pFunc 之 后 ，Test 函 数 中 局 部 对 象 i 的 值 
printf("Original i = %d\n", *pTrace); 



























































代码 清单 17-5 中 ， 在 Test 中 所 定义 的 葵 套 函数 InnerTest 引 用 了 该 髓 
套 函 数 的 外 部 函数 Test 所 声明 的 对 象 1， 然 而 我 们 在 整个 运行 过 程 中 发 现 
执行 一 切 正常 。 通 过 打印 Test 函 数 局 部 对 象 1 的 地 址 ， 我 们 发 现 该 对 象 所 
占用 的 栈 空间 始终 被 维护 着 ， 没 有 遭 到 破坏 。 但 是 ， 当 我 们 把 FetchData 
函数 中 注释 掉 的 Test (NULL) ; 重新 打开 时 ， 再 运行 就 可 能 会 发 生 异 

， 除 非 此 时 把 main 函 数 中 的 pFunc (data) ; 这 条 语句 给 屏蔽 掉 。 由 于 
在 调用 Test 之 后 ， 其 散 套 函数 InnerTest 的 执行 上 下 文 发 生 了 变化 ， 原 有 
维护 着 的 局 部 对 象 也 无 法 继续 维护 ， 所 以 再 次 通过 pFunc 调 用 藤 套 函数 
可 能 引发 异常 。 





由 于 嵌 套 函数 的 执行 上 下 文 无 法 使 用 其 他 手段 进行 保护 ， 所 以 它 无 
法 作为 一 个 闭 包 传递 到 外 部 环境 使 用 。 此 外 ， 目 前 也 只 有 GCC 才 支持 髓 
僚 函 数 定义 ， 而 LLVM Clang 社 区 也 明确 指出 将 很 有 可 能 永远 不 会 文 持 
供 套 函数 这 个 语法 特性 ， 取 而 代 之 的 是 ，Clang 编 译 器 已 经 实现 了 更 移 
进 的 Blocks 语 法 ， 我 们 将 在 第 18 章 做 详细 介绍 。 所 以 ， 笔 者 这 里 建议 各 
位 尽量 避免 将 舱 套 函数 用 在 实际 商业 化 的 项 目 工程 中 ， 一 来 适用 范围 不 





大 ， 二 来 可 移植 性 也 不 高 。 


17.5 “使 用 typeof 来 获取 对 象 类 型 


GNU 扩 展 语 法 特性 中 ， 笔 者 认为 typeof 操 作 符 是 贡献 最 大 的 语法 特 
性 之 一 。 通 过 typeof， 我 们 可 以 在 编译 时 获取 到 指定 对 象 的 类 型 ， 并 且 
typeof 表 达 式 可 作为 类 型 用 于 声明 其 他 对 象 。 我 们 可 以 通过 实现 更 简洁 
的 接口 ， 实 现 更 抽象 的 功能 模块 ， 从 而 使 我 们 的 C 语 言 代码 更 为 精简 ! 


typeof 与 sizeof、_Alignof 操 作 符 具有 相 类 似 的 特性 。 首 先 ， 它 们 一 
般 都 是 在 编译 时 进行 计算 ， 而 不 是 在 运行 时 ， 也 不 是 在 预 处 理 阶段 ， 其 
次 ， 如 有 果 其 操作 数 是 一 个 可 变 修改 类 型 或 具有 这 种 类 型 的 表达 式 ， 那 么 
对 这 些 表达 式 的 计算 则 要 放 到 运行 时 。 另 外 ，typeof 还 有 一 个 强大 特性 
是 ， 其 操作 数 可 以 是 一 个 函数 ， 并 且 当 其 操作 数 是 一 个 函数 名 时 ， 整 个 
表达 式 就 表示 为 一 个 函数 类 型 ， 而 不 是 指 疝 该 函数 的 指针 类 型 。 
需要 大 家 注意 。 











我 们 先 通过 代码 清单 17-6 来 看 看 typeof 操 作 符 的 一 般 使 用 。 


代码 清单 17-6 _ typeof 操作 符 的 一 般 使 用 





#include <stdio.h> 
#include <stdint.h> 


// 定义 函数 Func1 
static void Funci(int a) 


printf("a = %d\n", a); 

















// 通过 typeof 来 声明 一 个 函数 Func2， 其 返回 类 型 以 及 参数 列表 都 与 Func1 一 样 




















static typeof(Func1) Func2; 


// 定义 函数 Func2 
static void Func2(int b) 


printf("b = %d\n", b); 























// 定义 打印 当前 基本 数值 类 型 的 对 象 的 类 型 的 宏 
#define PRINT_TYPE(expr) _Generic((expr), float:puts("float type"), \ 
double:puts("double type"), \ 

















// 利用 typeof 来 定义 泛 型 的 取 绝 对 人 4 














default:puts("int type")) 


























。 这 里 将 0 强制 转 为 expr 的 类 型 ， 然 后 进行 比较 


#define GENERAL_ABS(expr) ( (expr) >= (typeof(expr))0? (expr) : -(expr)) 


int main(int argc, const char * a 























// 这 里 使 用 typeof(&Func1) 表 示 指 向 Func1 函 数 的 指针 类 型 





typeof(&Func1) pFunc = &Funci; 
pFunc(100 ) 


pFunc = &Func2， 
(*pFunc) (200); 


// 我 们 这 里 先 借用 下 一 节 将 会 描述 的 __ 
































rgv[]) 


auto_type 来 禁 取 表 达 式 的 类 型 ， 











// 这 样 可 以 验证 我 们 之 前 定义 的 宏 没 有 破坏 原 有 的 对 象 类 型 


auto_type i = GENERAL_ABS(- 
_auto type f GENERAL_ABS( 
_ auto type d GENERAL_ABS( 





1); 


-1.5f); 
-2.25); 


printf("i = %d f = %f, d = %f\n", i, f, d); 


PRINT_TYPE(i); 
PRINT_TYPE(f); 
PRINT_TYPE(d); 


// typeof 表 达 式 可 以 柑 套 ， 因 为 typeof 的 操作 数 既 可 以 是 一 个 表达 式 ， 也 可 以 是 一 个 类 型 





typeof(typeof(100)) const a = 














// 这 里 


typeof(a) 表 示 为 一 个 const int 类 型 


100; 





y 





Ie 


typeof(a) array[4] = (typeof(a)[]){1i, 2, 3, 4}; 

















// 这 里 | typeof(array ) 表 示 一 人 const int[4] 类 型 


typeof(array) arr2 = {5, 6, 7, 











// 这 里 声明 了 一 个 指向 const int[4 


























8}; 








Hy 





ea 


] 数 组 的 指针 类 型 ， 即 const int(*)[4] 
typeof(array) *pArray = &array 


// 这 里 与 上 一 条 语 名 一样， 同样 表示 const int(*)[4] 类 型 
typeof(&arr2) pArray2 = &arr2 





int n = 5; 











// 这 里 声明 了 一 个 变 长 数组 varr， 其 类 型 为 int[n]，n == 5 








// 然后 变量 n 的 值 变 为 了 6 


int varr[n++]; 





























// 这 里 用 varr 声 明了 一 个 变 长 数组 ， 
typeof(varr) varr2[3]; 

printf("varr2 count: %zu\n", 
printf("size of varr2[0]: %zu 








其 类 型 为 int[3] [n]， 


n == 5 


sizeof(varr2) / sizeof(varr2[0])); 


\n", sizeof(varr2[0]) 


// 声明 了 一 个 指向 int[n] Cn == 5) 的 变 长 数组 的 指针 对 象 pv， 

















// 其 类 型 为 int(*)[n]， 并 用 varr2 的 起 始 





typeof(varr) *pv = Varr2， 























// 这 里 的 空 声明 也 是 合法 的 ， 但 因为 不 产生 任何 副作用 ， 





























也 址 为 它 初始 化 


/ Sizeof(varr2[0][9]))， 




















受 有 变化 








ys 

















// 所 以 这 里 对 表达 式 pv[++n] 不 进行 计算 ， 所 以 n 的 值 也 
typeof (pv[++n]); 




















// 这 里 用 表达 式 pv[++n] 的 类 型 Be i. 象 varr3 

// varr3 的 类 型 为 : int[n] Cn == 5) ， 这 里 变量 n 的 值 变 为 了 7 

typeof (pv[++n]) 人 

printf("n = %d\n", 2 

printf("size of eps %zu\n", sizeof(varr3) / sizeof(varr3[0])); 













































































// 这 里 我 们 利用 了 GNU 扩 展 语法 的 取 跳 转 标 签 地 址 ， 用 于 表示 const void* 类 型 
typeof((const void*)&&GOTO LABEL) p = &a; 











if(*(const uint8_t*)p < 200) 
goto GOTO_LABEL ， 


puts("Hello, world!"); 
GOTO_LABEL : 


printf("The value is: %dxn"，(*pArray)[0] + pArray2[0][3]); 





代码 清单 17-6 中 我 们 可 以 看 到 typeof 操 作 符 的 强大 威力 。 它 不 仅 可 
对 对 象 与 函数 进行 操作 ， 而 且 还 能 作用 于 具体 类 型 ， 只 要 是 合法 的 对 
象 、 函 数 以 及 类 型 ， 包 括 跳 转 标签 的 地 址 ， 这 些 都 能 顺利 地 转换 为 相应 
的 类 型 ， 并 且 包 含 类 型 限定 符 。 此 外 ， 我 们 还 看 到 了 使 用 typeof 来 定义 
泛 型 取 绝 对 值 操作 。 由 于 通过 取 宏 参数 表达 式 的 类 型 来 转换 数值 0， 上 所 
以 我 们 无 需 关 心 每 种 类 型 所 对 应 的 0 的 形态 〈 比 如 单 浮 点 型 的 0 需要 表达 
为 0.0f， 双 精度 浮 点 型 的 0 需要 表达 为 0.0) ， 这 样 我 们 就 能 十 分 简单 地 
实现 对 任 一 基本 数值 类 型 做 取 绝 对 值 操 作 了 。 这 要 比 通 过 C11 标 准 所 引 
入 的 泛 型 选择 表达 式 根据 每 种 特定 类 型 做 特定 函数 调用 的 语句 表达 要 人 简 
洁 多 了 。 





typeof 的 威力 还 不 仅仅 体现 在 上 述 这 些 基 本 的 使 用 上 ， 我 们 在 第 6 章 
描述 结构 体 与 联合 体 的 时 候 提 到 过 ， 如 果 在 结构 体内 或 联合 体内 定义 一 
个 舱 套 的 命名 结构 体 与 联合 体 ， 那 么 该 拒 套 的 结构 体 或 联合 体 仍 然 与 其 





外 部 的 结构 体 或 联合 体 同 处 于 相同 的 作用 域 。 如 果 在 文件 作用 域 定 义 了 
一 个 结构 体 ， 并 且 该 结构 体内 又 定义 了 一 个 幅 套 的 命名 结构 体 ， 那 么 势 
必 就 影响 了 该 文件 作用 域 的 名 字 空 间 ， 倘 若 该 结构 体 是 定义 在 头 文件 

中 ， 并 且 要 被 引入 到 其 他 源 文件 中 使 用 ， 那 么 所 造成 的 污染 会 更 大 。 因 
此 我 们 一 般 不 建议 在 结构 体 中 定义 拱 套 命名 结构 体 ， 而 是 使 用 匿名 知 套 
结构 体 或 联合 体 ， 然 后 直接 用 它 声明 一 个 对 象 作 为 外 部 结构 体 或 联合 体 
的 一 个 成 员 。 在 标准 C11 中 ， 我 们 是 无 法 获取 一 个 结构 体 或 联合 体 中 蔡 
套 定义 的 匿名 结构 体 或 联合 体 的 具体 类 型 的 ， 但 在 GNU 扩 展 语 法 中 ， 这 
将 成 为 可 能 ! 代码 清单 17-7 将 为 大 家 展示 这 种 奇迹 。 














代码 清 蛙 17-7 通过 typeof 来 获取 结构 体 中 的 匿名 髓 僚 结 构 体 类 型 








#include <stdio.h> 
struct Frame 
struct 


float x, y; 
}point; 


struct 
float width, height; 
}size,; 
}; 
// 以 下 联合 体 作为 一 个 名 字 空 间 来 使 用 


union Namesapce 




















struct { int a, b; } class1， 
struct { float c, d; } class2; 
struct { double e, f; } class3,; 
过 
// 我 们 通过 定义 一 个 宏 来 方便 获取 一 个 结构 体 或 联合 体 中 的 肉 套 类 型 
#define FETCH_STRUCT_SUBTYPE(name, type) typeof((struct name){}.type) 
#define FETCH_UNION_ SUBTYPE(name, type) typeof( (union name){}.type) 
































int main(int argc, const char * argv[]) 


// 我 们 通过 在 typeof 中 构造 一 个 匿名 Frame 结 构 体 对 象 来 获取 其 point 的 类 型 
typeof((struct Frame){}.point) point = { 10.0f, 20.0f }; 







































































// 我 们 通过 在 typeof 中 使 类 型 投射 操作 来 访问 Frame 中 的 成 员 size， 获取 其 类 型 
typeof(((struct Frame*)NULL)->size) Size = { 90.0f，100.0f}， 























Struct Frame frame = { point, size }; 














// 我 们 通过 FETCH_UNION_SUBTYPE 宏 来 获取 Namespace 中 class2 的 类 型 
FETCH_UNION_ SUBTYPE(Namesapce, class2) object = {frame.point.x, 
frame.size.height}; 











printf("object.c = %f, object.d = %f\n", object.c, object.d); 








代码 清单 17-7 展 示 了 如 何 通 过 typeof 操 作 符 去 获取 结构 体 或 联合 体 
中 购 套 定义 的 匿名 结构 体 或 联合 体 类 型 ， 然 后 跟 普 通 的 结构 体 与 联合 体 
那样 去 声明 对 象 ， 正 常 使 用 。 我 们 可 以 看 到 ， 通 过 这 种 方式 也 能 在 很 大 
程度 上 避免 名 字 空 间 的 污染 ， 尤 其 在 做 一 些 通用 第 三 方 库 的 场合 会 十 分 
有 用 。 


17.6 ”使 用 _auto_type 做 类 型 自动 推导 


从 GCC 4.9 版 本 以 及 Clang 3.8 版 本 起 ， 两 者 均 引 入 了 十 分 现代 化 的 
编程 语言 特性 一 一 类 型 自动 推导 。 类 型 自动 推导 这 一 特性 早先 在 一 些 具 
有 动态 特性 的 编程 语言 上 用 得 很 多 ， 比 如 JavaScript、C# 等 ， 后 来 C++11 
标准 引入 了 这 一 特性 ， 在 比较 新 的 Swift 编程 语言 上 则 直接 以 类 型 推导 为 
主 进行 代码 编写 。GNU 语 法 扩展 引入 了 __auto_type 关 键 字 (前面 包含 两 
条 下 划 线 ) 用 于 声明 一 个 对 象 ， 该 对 象 类 型 将 通过 对 它 初始 化 的 初始 化 
器 的 类 型 进行 推导 。 因 此 大 家 要 注意 的 是 ， 如 果 要 通过 类 型 推导 来 声明 
一 个 对 象 ， 那 么 必须 为 该 对 象 直接 初始 化 ， 否 则 该 对 象 的 类 型 在 声明 时 
是 未 知 的 ， 这 将 导致 编译 错误 。 








通过 类 型 目 动 推导 来 声明 对 象 能 简化 一 些 代 码 ， 此 外 对 于 相似 代码 
的 抽象 也 很 有 帮助 。 代 码 清单 17-8 展 示 了 类 型 自动 推导 的 使 用 方式 及 其 
便利 之 处 。 





代码 清单 17-8 GNU 语法 扩展 的 类 型 自动 推导 





#include <stdio.h> 



































// 为 了 方便 起 见 ， 我 们 将 _auto_type 定 义 为 obj]， 这 样 更 为 简洁 

#define obj __auto_type 

// 我 们 利用 类 型 推导 来 定义 一 个 交换 两 个 变量 值 的 宏 

#define GENERAL SWAP(a, b) { _auto type tmp = (a); \ 
(a) = (b); \ 


(b) = tmp; } 


int main(int argc, const char * argv[]) 


obj a = 10, b = 20; 
GENERAL_SWAP (a, b); 
printf("a = %d, b = %d\n", a, b); 


obj c = 1.5f, d = -2.5f; 
GENERAL_SWAP(c, d); 
printf("c = %f, d = %f\n", c, d); 


Struct MyStruct { int i; float f; }; 

obj s = (struct MyStruct){1, 0.5f}; 

obj t = (struct MyStruct){100, -10.25f}; 

GENERAL_SWAP(s, t); 

printf("sum of s = %f, sum of t = %f\n", s.i + Ss.f, 
ne 


// 这 里 要 注意 的 是 ， 一 auto_type 不 能 对 一 个 声明 的 对 象 做 部 部 分 类 型 推导 
// 而 必须 是 完整 类 型 。 即 用 _ auto_type 声 明 的 对 象 只 能 单独 的 标识 符 的 式 出 现 。 
// 所 以 这 里 我 们 不 能 将 arr 声 明 为 : obj arr[] = { 1 2, 3, 4 };, 

// 初始 化 器 必须 是 一 个 匿名 数组 对 象 ， 以 提供 完整 的 类 型 信息 

obj arr = (int[]){ 1, 2, 3, 4 }; 









































































































































const obj x = = arr[2]; 
// 这 里 使 用 类 型 推导 时 ， 用 作 初 始 化 器 的 表达 式 x 的 类 型 限定 符 会 被 忽略 ， 
// 就 跟 普通 的 int y = x; 这 种 声明 方式 一 样 




































































y++; 
printf("y = %d\n", y); 














// 这 里 声明 的 指针 对 象 p 的 类 型 为 const int * 类 型 
const obj *p = arr,; 





























// 这 里 声明 的 指针 对 象 9 是 const int* const 类 型 ， 
// 由 于 通过 &x 推 导 ee int* 类 型 ， 
ZL 兵 单单 用 obj q 来 声明 就 是 const int* 类 型 。 

// 然后 这 里 又 用 const 去 修饰 指针 对 象 9， 那 么 q 的 类 型 就 变 为 const int* const 了 
const obj q = &x; 
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q = NULL; // 这 人 句 是 错误 的 
*q = 0) // 这 人 句 也 是 错误 的 





p = NULL; // 这 人 句 没 问题 
printf("*q = %d\n", *q); 





从 代码 清单 17-8 可 以 看 到 ， 我 们 通过 类 型 推导 能 用 更 简洁 的 方式 来 
实现 交换 两 个 任意 数据 类 型 对 象 的 值 ， 这 个 比 typeof 的 表达 方式 还 要 更 
简洁 一 些 。 另 外 ， 我 们 在 代码 清单 17-8 中 将 _ auto_type 定 义 为 obj， 这 在 
表达 上 也 更 为 简略 ， 代 码 看 上 去 也 更 舒服 。 最 后 又 通过 指针 与 数组 对 象 
的 类 型 推导 来 呈现 出 _auto_type 的 使 用 效果 以 及 约束 。 





17.7 ”对 复数 操作 的 扩展 





6.6 节 谈 到 了 复数 类 型 的 使 用 。 在 C 语 言 中 ， 复 数 类 型 是 一 个 比较 奇 
妙 的 数据 类 型 ， 它 像 一 个 结构 体 ， 然 而 我 们 却 可 以 用 比较 自然 的 方式 来 
表达 一 个 复数 ， 比 如 3.0+2.0i。 另 外 ， 我 们 访问 一 个 复数 的 实 部 的 时 候 
不 是 通过 访问 其 成 员 属 性 ， 而 是 通过 creal、crealf 或 creall 来 访问 ; 访问 
虚 部 的 时 候 则 需要 通过 cimagf、cimag 或 cimagl 来 访问 。GNU 语 法 扩展 引 
入 了 _ real_ 操作 符 (real 前 后 各 有 两 条 下 划 线 ) 用 于 访问 一 个 复数 的 实 
数 部 分 ;使 用 _imag_ 操作 符 (imag 前 后 各 有 两 条 下 划 线 ) 用 于 访问 一 
个 复数 的 虚数 部 分 。 这 么 做 的 好 处 是 我 们 无 需 关 心 当前 复数 实 部 与 虚 部 
的 类 型 ， 可 以 直接 获取 相应 的 值 。 此 外 ，GNU 语 法 扩展 中 也 引入 了 整数 
复数 ， 也 就 是 复数 的 实 部 与 虚 部 都 是 整数 ， 尽 管 整数 在 复数 操作 过 程 中 
起 不 到 什么 作用 ， 但 这 完善 了 整个 复数 类 型 系统 ， 并 且 再 度 突显 出 
_real 与 imag 操作 符 的 优势 。 


























GNU 语 法 扩展 还 引入 了 ~* 单 目 操作 符 作 用 于 一 个 复数 ， 用 于 计算 该 
复数 的 共 圈 复数 。 在 C99 标 准 中 ， 我 们 必须 通过 <complex.h> 标 准 头 文件 
中 的 conjf、conj 或 conjl 来 获取 指定 复数 的 共 斩 复 数 。 代 码 清单 17-9 给 出 
了 GNU 语 法 扩展 对 复数 类 型 的 延伸 特性 。 





代码 清单 17-9 GNU 语法 扩展 对 复数 的 延伸 特性 


#include <stdio.h> 
#include <complex.h> 


int main(int argc, const char * argv[]) 


// 这 里 声明 了 一 个 实 部 与 虚 部 都 是 short 类 型 的 复数 对 象 compi， 

// 在 complex 后 面 必须 跟 原生 基本 类 型 ， 不 外 E 跟 typedef 类 型 名 

// 因此 这 里 只 能 用 char、short、 int 等 ， 不 能 用 int8_t、int32_t 之 类 的 类 型 名 
complex short compi = 4 - 2i; 


// 对 compi 求 它 的 共 罗 复 数 


compi = ~compi; 


// 我 们 通过 real 与 imag _ 操作 符 来 获取 compi 的 实 部 与 虚 部 
printf("real = %d, imaginary = %d\n", 
_real (compi), __imag (compi)); 


























































































































代码 清单 17-9 以 一 个 简短 的 代码 示例 将 GNU 语 法 扩展 对 复数 的 延伸 
特性 都 列举 了 出 来 。 


17.8” 半 精度 浮上 反 类 型 








由 于 在 图 像 以 及 音 视 频 处 理 领 域 ， 数 字 信和 号 数据 所 需要 的 精度 要 求 
不 高 ， 比 如 像 当 前 用 得 较 多 的 图 像 像 素 格式 为 RGBA8888， 也 就 是 一 个 
像素 由 4 个 分 量 构成 ， 分 别 表示 红 、 绿 、 蓝 与 透明 度 ， 每 个 分 量 占 1 个 字 
节 大 小 ， 每 个 分 量 的 取 值 范围 一 般 为 从 0 到 255。 在 很 多 专用 处 理 器 的 处 
理 过 程 中 对 这 种 数字 图 像 数 据 用 单 精度 浮 点 显然 会 浪费 带宽 ， 因 此 
IEEE754 标 准 协 会 在 2008 年 新 发 布 的 标准 中 正式 引入 了 半 精 度 浮 点 


(half-precision binary floating-point) 。 








半 精 度 浮 点 数 的 规格 化 表达 方式 与 单 精 度 类 似 ， 它 具有 1 位 符号 
位 ，5 位 指数 位 ， 尾 数 则 有 11 位 ， 其 中 经 指数 偏差 为 15。 








不 过 由 于 当前 CPU 对 半 精 度 的 支持 十 分 有 限 ， 像 x86 处 理 器 在 引入 
了 AVX/XOP 操 作 时 (Intel 处 理 器 是 在 SandyBridge 架 构 上 才刚 引入 了 
AVX) 才 引 入 了 对 半 精 度 浮 点 数 数据 存储 格式 的 支持 ， 而 ARM 处 理 器 
则 更 早 一 些 ， 在 ARMv7 架 构 出 炉 时 则 通过 NEON 技 术 引 入 了 对 半 精 度 浮 
点 数据 存储 格式 的 支持 。 大 家 注意 到 ， 这 些 处 理 器 在 指令 上 仪 仅 是 引入 
了 对 半 精 度 浮 点 数据 的 存储 表示 ， 而 没有 提供 任何 算术 计算 操作 。 它 们 
所 文 持 的 仅仅 是 将 半 精 度 浮 点 数 与 单 精度 浮 点 数 之 间 能 相互 转换 的 特 
性 ， 如 果 要 对 半 精 度 浮 点 数 做 实际 计算 ， 则 还 需要 软件 库 的 支持 。 当 

















然 ， 目 前 在 处 理 器 上 一 般 不 太 会 对 半 精 度数 据 做 算术 计算 ， 而 是 将 它们 
交 给 GPU 或 其 他 硬件 加 速 器 进行 处 理 。 但 是 ， 像 OpenCL 这 种 主要 做 数 
据 密集 型 计算 的 平台 已 经 引入 了 对 半 精 度 浮 点 数 算术 计算 的 支持 ， 只 要 
当前 操作 环境 支持 。 而 像 Apple 在 2014 年 新 出 的 Metal API 则 直接 对 半 精 
度 浮 点 数 加 以 支持 ， 因 为 能 在 Metal 上 运行 的 GPU 都 能 支持 半 精 度 浮 点 
数 的 算术 运算 。 因 此 GNU 语 法 扩展 引入 了 对 半 精 度 浮 点 数 的 支持 也 算 比 


较 及 时 。 














在 GNU 语 法 扩展 中 ， 使 用 _fp16 关 键 字 (前 面 带 有 两 条 下 划 线 ) 来 
声明 一 个 半 精 度 浮 点 数 。 我 们 需要 注意 的 是 ， 在 遵循 GNU 语 法 扩展 的 C 
语言 中 ， 我 们 只 能 将 一 个 半 精 度 浮 点 数 对 象 用 于 数据 存储 ， 而 不 能 用 于 
计算 ， 除 非 有 第 三 方 库 的 支持 ， 否 则 编译 器 也 是 直接 会 把 该 算术 运算 编 
译 为 先 将 半 精 度 浮 点 转换 为 单 精度 浮 点 ， 计 算 完 毕 后 再 转 回 半 精 度 浮 
点 。 代 码 清单 17-10 展 示 了 使 用 半 精 度 浮 点 数 的 简单 例子 。 














代码 清单 17-10 ”使 用 半 精 度 浮 点 数 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


float a = 10.5f; 
_fpi6 h = a; 


// 如 果 此 段 代码 不 经 过 优化 ， 那 么 这 个 printf 函 数 对 实 参 h 做 了 两 次 操作 ， 
// 第 一 次 是 将 半 精 度 浮 点 转 为 单 精度 浮 点 第 二 次 则 是 将 单 精度 浮 点 转 为 双 精 度 浮 点 
printf("The half-floating number is: %f\n", h); 


// 这 里 的 减法 计算 是 先 将 半 精 度 浮 点 数 h 转 换 为 单 精度 浮 点 
// 然后 计算 完 之 后 再 转 回 半 精度 浮 点 数 

h -= 0.5f， 

printf("h = %f\n", h); 






















































































h = 100000.5f; 






































// 由 于 100000 .5 已 经 超过 了 半 精 度 浮 点 所 外 0 所 以 这 里 将 打印 inf， 表 示 无 穷 大 
printf("The half-floating number is: %f\n", h); 


























通过 代码 清单 17-10， 我 们 能 看 到 半 精 度 浮 点 数 在 C 语 言 中 使 用 时 的 
特性 了 。 如 果 不 涉及 到 GPU 或 其 他 计算 加 速 器 ， 不 要 使 用 半 精 度 浮 点 
数 。 如 果 我 们 需要 将 数据 传 到 GPU 等 加 速 右 执行 ， 那 么 我 们 可 以 移 用 单 
精度 浮 点 数 进行 计算 处 理 ， 完 成 之 后 再 转 成 半 精 度 译 点 数 人 存放 到 存储 器 
中 


17.9 长 度 为 零 的 数组 


在 GNU 语 法 扩展 中 ，C 语 言 能 文 持 声 明 长 度 为 0 的 数组 。 这 在 通 币 
情况 下 意义 不 大 ， 但 是 当 它 作 为 一 个 结构 体 最 后 一 个 成 员 时 ， 则 功能 相 
当 于 之 前 提 到 的 灵活 数组 作为 结构 体 最 后 一 个 成 员 ， 而 且 比 C99 标 准 所 
引入 的 这 个 语法 特性 更 为 灵活 。 


长 度 为 0 的 数组 对 象 作 为 结构 体 的 成 员 与 C99 标 准 引入 的 灵活 数组 对 
象 作 为 结构 体 成 员 相 比 ， 在 语法 特性 上 十 分 相似 ， 但 有 以 下 这 些 不 同 。 


1) 由 于 灵活 数组 对 象 是 不 完整 类 型 ， 所 以 我 们 不 能 用 sizeof 操 作 符 
对 它 进 行 操作 。 而 长 度 为 0 的 数组 可 以 作为 sizeof 操 作 符 的 操作 数 ， 并 且 
整个 sizeof 表 达 式 的 计算 结果 为 0。 


2) 灵活 数组 对 象 作 为 结构 体 成 员 时 ， 该 结构 体 必 须 至 少 含 有 一 个 
命名 非 空 成 员 对 象 《 即 该 成 员 对 象 用 sizeof 计 算 结果 必须 大 于 0) 。 而 长 
度 为 零 的 数组 作为 结构 体 成员 时 没有 这 一 要 求 ， 也 就 是 次 长 度 为 零 的 数 
组 对 象 完全 可 以 作为 结构 体 中 唯一 的 成 员 。 








3) 在 C99 标 准 中 ， 禹 有 灵活 数组 对 象 作为 成 员 的 结构 体 或 包含 这 种 
结构 体 对 象 的 联合 体 ， 不 能 作为 男 一 个 结构 体 的 成 员 或 一 个 数组 的 茶 个 
元 素 。 而 在 GNU 语 法 扩展 中 ， 这 些 都 允许 。 


正 因 如 此 ，GNU 语 法 扩展 也 允许 定义 不 含 任何 成 员 的 结构 体 与 联合 
体 ， 这 样 的 结构 体 与 联合 体 的 大 小 为 0 个 字 节 。 代 码 清单 17-11 展 示 了 长 
度 为 0 的 数组 作为 结构 体 成 员 与 灵活 数组 作为 结构 体 成 员 的 用 法 比较 示 
例 。 











代码 清单 17-11 ”长 度 为 0 的 数组 作为 结构 体 成 员 VS 灵 活 数 组 作为 结 
构 体 成 员 





#include <stdio.h> 


// GNU 语 法 扩展 也 允许 定义 一 个 不 含 任何 成 员 的 结构 体 
struct Dummy 











}; 


// 如 果 是 以 灵活 数组 对 象 作为 结构 体 成 员 ， 那 么 该 结构 体 中 至 少 必须 含有 一 个 命名 成 员 对 象 
Struct FlexibleArrayStruct 


{ 
int a; // 这 里 命名 成 员 对 象 a 不 能 缺 省 
int flex[]; 























了 


// ZeroArrayStruct 结 构 体 类 型 的 定义 没有 问题 
struct ZeroArrayStruct 


{ 
// 这 里 不 需要 含有 一 个 命名 非 空 成 员 对 象 
int zero[0]， 



































了 


int main(int argc, const char * argv[]) 


// GNU 语 法 扩展 允许 直接 声明 一 个 长 度 为 9 的 数组 对 象 


int arr[90]; 


// 长 度 为 零 的 数组 对 象 arr 的 大 小 为 9 


printf("The size is: %zu\n", sizeof(arr)); 


// 不 含 任何 成 员 对 象 的 Dummy 结 构 体 类 型 的 大 小 也 为 0 


printf("Dummy size is: %zu\n", sizeof(struct Dummy)); 











// ZeroArrayStruct 结 构 体 大 小 也 为 0 
printf("ZeroArrayStruct size is: %zu\n", 
sizeof(struct ZeroArrayStruct)); 


struct FlexibleArrayStruct *pFS = NULL; 
// 以 下 sizeof(fs.flex) 这 一 表达 式 是 错误 的 ! 因为 pFS->flex 是 不 完整 类 型 ， 
// 它 不 能 作为 sizeof 操 作 符 的 操作 数 


printf("size = %zu\n", sizeof(pFS->flex)); 








struct ZeroArrayStruct *pZS = NULL; 


// 以 下 的 sizeof(pZS->zero) 表 达 式 是 没 问 题 的 ， 大 小 为 9 


printf("size = %zu\n", sizeof(pZS->zero)); 


// 含有 灵活 数组 成 员 以 及 长 度 为 9 的 数组 成 员 的 结构 体 不 能 直接 用 初始 化 器 进行 初始 化 ， 
// 也 不 能 用 该 结构 体 构造 一 个 匿名 结构 体 对 象 ， 
// 所 以 这 里 先 使 用 匿名 数组 对 象 ， 然 后 再 转 为 指向 结构 体 的 指针 

pFS = (struct FlexibleArraySstruct*)(int[]){4, 0, 1, 2, 3}; 
pZS = (struct ZeroArrayStruct*)(int[]){1i, 2, 3, 4}; 



























































int sum = 0; 
for(int i = 0; i < pFS->a; i++) 
sum += pFS->flex[i]; 


printf("flex sum is: %d\n", sum); 

sum = 0; 

for(int i = 0; i < pFS->a; i++) 
Sum += pZS->zero[i]; 


printf("zero sum is: %d\n", sum); 


17.10 ”对 可 变 参 数 个 数 的 宏 的 语法 扩展 





C99 标 准 引入 了 可 定义 可 变 参 数 个 数 的 宏 的 语法 特性 ， 但 是 正如 我 
们 在 10.1.5 节 中 所 描述 的 ， 用 于 表示 可 变 实 参 的 标识 符 ”VA_ARGS_ 只 
能 完全 痊 换 掉 可 变 实 参 部 分 ， 如 果 可 变 实 参 是 空 ， 那 么 它 也 就 相当 于 一 
个 空白 符 。 这 会 引发 要 定义 类 似 printf 这 种 函数 的 问题 。 我 们 在 10.1.5 节 
中 提 到 ， 如 果 我 们 要 用 宏 来 定义 printf， 我 们 只 能 用 #define 
MY_PRINT (...) printf ( VA_ARGS _) 这 种 形式 。 








而 在 GNU 语 法 扩展 中 ， 引 入 了 如 号 操作 符 与 容 宏 拼接 符 相 结合 的 方 
式 ， 可 让 并 拼接 符 左 侧 的 去 号 根据 _VA_ARGS_ 所 蔡 换 的 实 参 来 定 。 
如 果 VA_ARGS_ 所 蔡 换 的 实 参 不 缺 省 ， 那 么 逗号 保留 ， 如 果 为 缺 
省 ， 那 么 去 号 也 会 被 省 去 。 因 此 ， 在 文 持 GNU 语 法 扩展 的 情况 下 ， 我 们 
可 以 将 上 述 的 MY_PRINT 定 义 为 : #define MY_PRINT (fmt，.…) 
printf (fmt， 椅 VA_ARGS_) 。 这 么 一 来 ， 当 我 们 使 用 
MY_PRINT (“Hello，worldn”) ; 时 就 不 会 出 现 编译 错误 了 ， 因 为 此 
时 可 变 实 参 列表 为 空 ， 那 么 在 蔡 换 _ VA_ARGS_ 的 时 候 由 于 它 用 雁 拼 
接 符 与 前 面 的 逗号 拼接 ， 形 成 “<， 撩 ”的 形式 ， 所 以 前 面 的 逗号 也 会 被 省 
去 ， 这 样 就 不 会 出 现 printf (“Hello，worldn”，) 这 种 宏 替 换 了 。 











此 外 ，GNU 语 法 扩展 中 还 能 直接 用 #define MY_PRINT (fmt， 


args…) printf (fmt，##args〉 这 种 宏 定义 形式 。 这 里 ，args 后 面 紧 跟 ... 表 
示 该 参数 是 可 变 个 数 的 参数 列表 ， 这 样 在 其 蔡 换 列表 中 可 以 直接 用 args 
来 表示 可 变 个 数 的 实 参 。 命 名 的 可 变 个 数 参数 显然 更 具 表 达 力 ， 而 且 也 
使 得 代码 更 为 整洁 。 代 码 清 单 17-12 展 示 了 可 变 参 数 宏 的 扩展 使 用 。 





代码 清单 17-12 ”可 变 个 数 实 参 的 宏 的 GNU 扩 展 





#include <stdio.h> 


// 使 用 匿名 可 变 参数 个 数 的 宏 参数 
#define MY_PRINT(fmt, args...) printf(fmt, ## args) 


// 使 用 命名 可 变 个 数 的 宏 参 数 



































#define MY_LOG(fmt, mh 0) printf(fmt, ## __VA ARGS ) 
// 将 MY_EXPR 作 为 一 个 逗号 表达 式 的 宏 来 使 用 
#define MY_EXPR(a, args...) (a, ## args) 


int main(int argc, const char * argv[]) 


MY_PRINT("Hello, world!\n"); 
MY_LOG("Hello, world!\n"); 


MY_PRINT("The string is: %s\n", "yes"); 
MY_LOG("The string is: %s\n", "no"); 


// 相当 于 : int a = (10); 
int a = MY_EXPR(10); 
printf("a = %d\n", a); 











// 相当 于 : a += (0,，20); 
a += MY_EXPR(0, 20); 
printf("a = %d\n", a); 





这 个 GNU 语 法 扩展 可 谓 是 对 C99 标 准 的 一 个 补 完 ， 使 得 可 变 参数 个 
数 的 宏 定 义 在 语法 体系 上 更 加 完备 ， 而 且 在 使 用 上 也 不 会 有 什么 漏洞 。 





17.11 ” case 语句 中 使 用 范围 表达 式 


GNU 语 法 扩展 中 引入 了 一 个 十 分 便捷 的 case 语 句 范围 表达 式 ， 可 以 
使 得 当前 的 case 条 件 作 用 于 某 个 范围 ， 而 不 仅仅 是 一 个 值 上 。 比 如 ， 
case 1...5 就 表示 值 如 果 在 1 一 5 的 范围 内 则 满足 条 件 ， 执 行 该 case 语 句 中 
的 逻辑 。 这 里 ， 省 略 号 … 就 作为 一 个 范围 操作 符 ， 其 左右 两 个 操作 数 之 
间 必 须 至 少 要 用 一 个 空白 符 进 行 分 隔 ， 如 果 写 成 1..5 这 种 形式 会 引发 词 
法 解析 错误 。 范 围 操作 符 的 操作 数 可 以 是 任 一 整数 类 型 ， 包 括 字 符 类 
型 。 另 外 ， 范 围 操作 符 的 左 操作 数 的 值 应 该 小 于 或 等 于 右 操作 数 ， 否 则 
该 范围 表达 式 就 会 是 一 个 空 条 件 范 围 ， 它 永远 不 成 立 。 代 码 清 单 17-13 
展示 了 对 case 语 句 范 围 表 达 式 的 使 用 示例 。 











代码 清单 17-13” ”case 语句 范围 表达 式 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


int a = 1; 
const int c = 10; 


switch(a) 





// 这 条 case 语 句 是 合法 的 ， 并 且 与 case 1 等 效 
case 1 ... 1: 

printf("a = %d\n", a); 

break; 


// 这 条 case 语 句 中 的 范围 操作 符 的 左 操作 数 大 于 右 操 作 数 ， 
// 因此 它 是 一 个 空 条 件 范围 ， 这 条 case 语 句 下 的 逻辑 永远 不 会 被 执行 
case 2 ... 1: 

puts("Hello, world!"); 

break; 




































































// 使 用 const 修 饰 的 对 象 也 可 作为 范围 操作 符 的 操作 数 
sd OS 


case 8 


puts("Wow!™"); 
break; 


defauilt: 
break; 


} 


char ch = 'A' 
switch(ch) 
{ 








// 从 'A' 到 'Z' 的 ASCII 码 范围 

Case "A, ss LZ; 
printf("The letter is: %c\n", ch); 
break; 





// 从 '0' 到 '9' 的 ASCII 码 范围 
case '0' ... '9'; 
printf("The digit is: %c\n", ch); 


defauilt: 
break; 





我 们 通过 代码 清单 17-13 可 以 看 到 ，case 范 围 表达 式 即 可 充当 一 条 让 
语句 ， 像 case 1...5 就 好 比 if (a>=1&&a<=5) ， 而 从 表达 形式 上 看 则 更 为 
简洁 。 当 然 ， 范 围 操作 符 的 操作 数 必 须 是 一 个 编译 时 的 常量 ， 不 能 是 一 





17.12 ” 投 别 到 一 个 联合 体 类 型 


我 们 之 前 已 经 学 到 过 ， 在 C 语 言 标 准 中 ， 我 们 不 能 将 茶 个 对 象 转换 
为 一 个 结构 体 或 联合 体 类 型 ， 我 们 只 能 将 茶 个 对 象 的 地 址 转换 为 指 回 一 
个 结构 体 或 联合 体 类 型 的 指针 。 不 过 在 GNU 语 法 扩展 中 ， 我 们 却 可 以 将 
一 个 对 象 转换 为 一 个 包含 该 对 象 类 型 的 联合 体 类 型 。 该 语法 扩展 增加 了 
对 联合 体 类 型 的 投射 操作 ， 其 实 也 在 一 些 场合 简化 了 代码 。 代 码 清 单 
17-14 展 示 了 联合 体 类 型 的 投 冉 操 作 代码 示例 。 


代码 清单 17-14 ”联合 体 类 型 的 投射 操作 





#include <stdio.h> 
#include <math .h> 


Struct MyPoint 


float x, y; 
/ 
/** 定义 了 一 个 名 为 UnionTest 的 联合 体 ， 其 中 包含 了 三 个 对 象 成 员 */ 
union UnionTest 
int a; 
double dd; 
struct MyPoint point; 
/ 


/** 计算 并 打印 出 形 参 t 中 的 点 point 到 原点 之 间 的 距离 */ 
static void OutputDistanceToOrigin(union UnionTest t) 

















float distance = sqrtf(t.point.x * t.point.x + 
t.point.y * t.point.y); 
printf("Distance to origin: %f\n", distance); 
int main(int argc, const char * argv[]) 
int a = 1; 


// 这 里 通过 对 联合 体 UnionTest 的 投射 操作 ， 将 整 型 对 象 a 转 换 为 UnionTest 联 合体 类 型 



































union UnionTest un = (union UnionTest)a; 
printf("value is: %d\n", un.a); 


double d = 5.0; 
// 这 里 通过 对 联合 体 UnionTest 的 投射 操作 ， 将 双 精 度 浮 点 对 象 d 转 换 为 UnionTest 联 合体 类 型 


un = (union UnionTest)d; 
printf("value is: %f\n", un.d); 
































Struct MyPoint mp = { 3.0f, -4.0f }; 


// 这 里 通过 对 联合 体 UnionTest 的 投射 操作 ， 

// 将 MyPoint 结 构 体 类 型 对 象 np 转换 为 UnionTest 联 合体 类 型 

un = (union UnionTest)mp; 

printf("x = %f, y = %f\n", un.point.x, un.point.y); 


// 这 里 可 直接 用 联合 体 的 投射 操作 将 mp 结构 体 转换 为 UnionTest 联 合体 类 型 


OutputDistanceToorigin((union UnionTest )mp ) ， 
























































17.13 ”使 用 二 进 制 整数 字面 量 


在 C 语 言 标准 中 ， 我 们 通过 使 用 前 级 0 表示 一 个 八进制 整数 (比如 : 
012 表 示 十 进 制 整数 10) ; 通过 0x 或 0X 前 级 表示 一 个 十 六 进 制 整 数 或 十 
六 进 制 浮 点 数 ( 比 如 : 0x10 表 示 十 进 制 整 数 16，0x3.8p0 表 示 十 进 制 浮 
点 数 3.5) 。 而 在 GUN 语 法 扩展 中 可 以 通过 0b 或 0B 前 级 来 表示 一 个 二 进 
制 整 数 ， 比 如 : 0b01011010 表 示 十 进 制 整数 90，0B0011 表 示 十 进 制 整数 








3。 


17.14 使 用 _attribute “指定 函数 、 对 象 与 类 型 的 
属性 


我 们 此 前 在 10.8 节 提 到 过 ， 可 以 用 #pragma 预 编译 指示 符 来 描述 一 
段 代码 的 特性 。 而 在 GNU 语 法 扩展 中 ， 我 们 除了 可 以 用 #pragma 预 编译 
指示 符 之 外 ， 还 能 使 用 _attribute (attribute 前 后 各 有 两 条 下 划 线 ) 说 
明 符 (specifier〉 所 指定 的 属性 来 指明 用 它 所 修饰 的 函数 、 对 象 或 类 型 
的 相关 特性 。 当 __attribute ”用 于 修饰 对 象 时 ， 它 就 如 同 C 语 言语 法 体系 
结构 中 的 类 型 限定 符 (type qualifier) ， 跟 const、volatile、restrict 等 属 
一 类 。 当 _ attribute_ 修饰 一 个 函数 时 ， 它 就 相当 于 一 个 函数 说 明 符 
(function specifier) ， 跟 inline、_Noreturn 属 同一 类 。 倘 和 藻 _attribute_ 
在 函数 定义 中 进行 修饰 ， 那 么 该 限定 符 可 以 放 在 函数 声明 的 最 前 面 ， 也 
可 以 放 在 函数 标识 符 前 ; 而 如 果 只 是 函数 声明 ， 那 么 该 限定 符 除 了 上 述 
两 个 位 置 之 外 ， 还 能 放 在 函数 声明 的 末尾 。 当 __attribute “修饰 一 个 结 
构 体 、 联 合体 或 枚 举 类 型 时 ， 该 限定 符 只 能 放 在 类 型 标识 符 之 前 。 








__attribute _ 说 明 符 的 基本 语法 为 : 





_attribute _ (( attribute-list ))。 








这 里 要 注意 的 是 ，_ attribute “所 指定 的 属性 列表 必须 前 后 用 双 


括号 包围 ， 属 性 列表 中 如 条 有 多 个 属性 ， 那 么 用 喜 号 分 隔 。 当 

_ attribute “要 用 来 修饰 一 组 函数 声明 时 ， 可 以 将 它 放 在 第 一 个 图 数 声 
明 的 最 前 面 ， 那 么 后 续 声 明 的 函数 都 会 受到 此 _ attribute “的 修饰 。 代 
码 清单 17-15 展 示 了 __attribute “的 基本 使 用 以 及 其 语法 特性 


代码 清单 17-15 ” attribute ”的 基本 使 用 及 语法 





#include <stdio.h> 
#include <stdint.h> 
#include <stdalign.h> 














/** 用 _attribute__ 修饰 一 个 命名 结构 体 类 型 */ 
struct _attribute ((packed)) Test 








int8_t a; 
int b; 
}; 


/xx 使 用 _attribute__ 修饰 一 个 匿名 结构 体 类 型 */ 
struct _ attribute ((packed)) 


















































Int16 t s; 

double dd; 
}sstruct; 
/** 使 用 3 个 属性 来 修饰 同一 个 函数 ， 分 别 是 4 字 节 对 齐 、 总 是 内 联 、 纯 函数 */ 
static int _ attribute ((aligned(4), always_ inline, pure)) 
MyTestFunc(void) 
{ 


return 0b01100100 ， 


// 对 MyFunc 函 数 进行 声明 ， 此 时 attribute _ 说明 符 可 以 放 在 函数 声明 的 末尾 


extern void MyFunc(int a) _ attribute ((pure)); 





























/** 使 用 _attribute 来 修饰 一 个 形 参 对 象 */ 
static void foo(int _ attribute ((aligned(8))) a) 


// 在 GNU 语 法 扩展 中 ，alignof 的 操作 数 可 以 是 一 个 表达 式 ， 而 不 单单 只 是 类 型 名 


printf("The alignment of a is: %zu\n", alignof(a)); 



















































































性 修饰 。 
于 f2; always_inline 属 性 只 作用 于 f3 











地 











// 这 里 声明 了 三 个 函数 ， 这 三 个 函数 的 返回 类 型 都 是 int， 并 且 都 jaligned(8) 的 属 
// 而 weak 属 性 只 作用 于 f1; pure 属 性 只 作用 { 
_attribute ((aligned(8))) int 

_attribute ((weak)) fi(int a, int b), 

_ attribute_((pure)) f2(int a, int b), 

_ attribute ((always_inline)) f3(void); 





hh 




































































// 以 下 分 别 对 这 三 个 函数 进行 定义 。 在 定义 时 ，_ attribute 可 缺 省 
int f1i(int a, int b) 
{ 


























return a*a+b™* b; 


} 
int f2(int a, int b) 


return a + b; 


int f3(void) 
{ 


return 0123; 


int main(int argc, const char * argv[]) 


// 这 里 我 们 将 会 看 到 ，struct Test 类 型 的 大 小 为 5 个 字 节 
printf("size of Test: %zu\n", sizeof(struct Test)); 


// 这 里 我 们 将 会 看 到 ，sStruct 的 大 小 为 19 个 字 节 
printf("size of SStruct: %zu\n", sizeof(sStruct)); 























int a = MyTestFunc(); 
printf("a = %d\n", a); 


foo(100); 


printf("f1 = %d\n", f1(3, 4)); 
printf("f2 = %d\n", f2(3, 4)); 
printf("f3 = %d\n", f3()); 


// 这 里 将 声明 的 指针 对 象 p 用 aligned(16 ) 属 性 来 修饰 ， 

// 同时 ， 指 明 (*p) 的 属性 为 aligned(4) 

int _ attribute ((aligned(4))) * _ attribute ((aligned(16))) p = &a; 
printf("align of p is: %zu\n", alignof(p)); 

printf("align of *p is: %zu\n", alignof(*p)); 












































代码 清单 17-15 比 较 详细 地 介绍 了 __attribute_ 说 明 符 的 使 用 方法 以 
及 其 语法 特性 。 下 面 我 们 将 分 别 介 绍 _ attribute “可 用 来 修饰 函数 、 变 
量 以 及 类 型 的 常用 属性 。 


17.14.1 attribute _ 用 于 修饰 函数 的 属性 


以 下 将 列举 利用 的 函数 属性 ， 这 些 属 性 一 般 能 用 于 大 部 分 处 理 右 环 
境 ， 并 且 在 GCC 编译 堪 以 及 Clang 编 译 侨 上 均 能 文 持 。 


1.aligned (alignment) 


aligned 属 性 修饰 一 个 函数 时 ， 用 于 指示 该 函数 的 首 地 址 至 少 需 要 
alignment 个 字 市 对 齐 。 如 果 我 们 所 指定 的 alignment 字 节 数 小 于 默认 的 对 
齐 字 节 数 ， 那 么 以 默认 的 字 节 对 齐 为 准 。 如 果 我 们 使 用 编译 命令 行 选 
项 “-falign-functions” 对 所 有 函数 做 全 局 的 字 节 对 齐 指定 ， 那 么 我 们 再 用 
aligned 属 性 修饰 茶 个 函数 时 ， 该 函数 将 以 我 们 当前 所 指定 的 字 节 数 做 对 
3s 





我 们 这 里 要 注意 的 是 ， 用 aligned 属 性 修饰 一 个 函数 后 ， 该 函数 实际 
的 字 节 对 齐 数 仍然 以 连接 器 的 安排 为 准 ， 因 此 该 属性 也 是 一 个 暗示 性 的 
属性 ， 当 然 在 大 部 分 情况 下 ， 函 数 会 满足 我 们 所 指定 的 最 低 字 市 个 数 对 
齐 的 要 求 ， 如 果 我 们 所 指定 alignment 不 太 大 的 话 。 最 后 要 注意 的 是 ， 我 
们 要 指定 函数 的 字 节 对 齐 要 求 必 须 使 用 _attribute “说 明 符 ， 而 无 法 使 
用 C11 标 准 所 引入 的 _Alignas 说 明 符 ，_Alignas 只 能 用 于 修饰 对 象 。 代 码 
清单 17-16 展 示 了 aligned 属 性 的 大 概 使 用 方式 。 














代码 清单 17-16 aligned 属 性 修饰 函数 的 使 用 





#include <stdio.h> 


#include <stdint.h> 
#include <stdalign.h> 




















/** 指定 func1 首 地 址 至 少 满足 16 字 节 对 齐 ， 这 里 再 使 用 in1Line 函 数 说 明 符 也 没 问题 */ 
static inline void attribute ((aligned(16))) funci(int a) 


{ 

















printf("a = %d\n", a); 
printf("%s address: QOx%.16txX\n", _ func , (uintptr_t)&funci1); 


static void _attribute ((aligned(64))) func2(void) 
func1i(100); 
printf("func1 alignment: %zu\n", alignof(func1)); 
printf("%s alignment: %zu\n", __func_, alignof(func2)); 
printf("%s address: %.16tX\n", _ func , (uintptr_t)é&func2); 


int main(int argc, const char * argv[]) 


func2(); 





2.always_inline 


用 此 属性 修饰 一 个 函数 时 ， 指 示 编 译 器 当前 函数 总 是 内 联 。 如 果 编 
译 器 由 于 某 些 限制 而 无 法 将 指定 的 函数 做 内 联 处 理 ， 那 么 在 编译 时 就 会 
报错 。 用 always_inline 属 性 修饰 的 函数 可 以 通过 一 个 函数 指针 做 间接 调 
用 ， 编 译 器 将 根据 编译 优化 选项 以 及 上 下 文 来 判定 此 间接 调用 是 否 也 能 
进行 内 联 处 理 ， 但 如 果 间 接 调 用 内 联 失败 则 不 会 引发 编译 错误 。 代 码 清 
单 17-15 已 经 含有 一 些 对 always_inline 属 性 的 使 用 ， 而 代码 清单 17-17 则 
进一步 展示 了 always_inline 属 性 的 用 法 。 








代码 清单 17-17 _ always_inline 属 性 的 进一步 使 用 





#include <stdio.h> 

















/** 用 always_inline 属 性 修饰 函数 fFunc */ 
static int _attribute ((always_inline)) func(void) 











return 100; 


int main(int argc, const char * argv[]) 


// 这 里 对 func 的 函数 调用 会 被 内 联 
int a = func(); 




















// 这 里 获取 func 的 地 址 也 完全 没 问 题 
int (*pFunc)(void) = &func,; 
printf("func address: Ox%.16zX\n", (size_t)pFunc); 





a += pFunc(); 
printf("a = %d\n", a); 





3.flatten 


用 此 属性 修饰 的 函数 ， 在 该 函数 中 调用 的 每 一 个 函数 都 将 尽 可 能 地 
做 内 联 处 理 。 而 用 flatten 属 性 所 修饰 的 那个 函数 是 否 内 联 ， 则 根据 编译 
峰 当 前 的 编译 选项 以 及 当前 上 下 文 来 定 。 代 码 清单 17-18 展 示 了 flatten 的 
使 用 与 效果 。 


代码 清单 17-18 flatten 属 性 的 使 用 与 效果 





#include <stdio.h> 
static int funci(void) 


return 100; 


static int func2(int a, int b) 


return a*a-b™* b; 


static void func3(int a) 


printf("a^2 = %d\n", a * a); 





























/** 使 用 flatten 属 性 修饰 函数 FlattenTest */ 
static void _attribute ((flatten)) FlattenTest(void) 
{ 





int a = funci1(); 
printf("a = %d\n", a); 


a += func2(5, 4); 
printf("a = %d\n", a); 


func3(a); 
} 
int main(int argc, const char * argv[]) 
t 
FlattenTest(); 
} 


ee | 


从 代码 清单 17-18 我 们 可 以 在 FlattenTest 函 数 中 设置 断 点 ， 然 后 从 反 
汇编 中 能 看 到 ， 除 了 对 标准 库 函 数 的 printf 调 用 没有 内 联 外 ， 对 func1、 
func2、func3 函 数 的 调用 全 都 内 联 了 。 由 于 printf 函 数 属于 库 函 数 ， 在 当 
前 编译 上 下 文中 无 法 获得 其 具体 实现 ， 所 以 对 它 的 调用 无 法 内 联 。 而 在 
FlattenTest 函 数 上 面 所 定义 的 func1、func2 和 func3 尽 管 没有 显 式 地 使 用 
inline 或 attribute 〈( (always_inline) ) 去 修饰 ， 但 在 用 flatten 属 性 修 
饰 的 FlattenTest 函 数 中 仍然 做 了 内 联 处 理 。 








4.cdecl/stdcall/fastcall/ms_abi/sysv_abi 


这 些 属性 用 在 x86 处 理 器 系统 平台 上 ， 分 别 表 示 所 修饰 的 函数 使 用 C 
函数 调用 约定 、 标 准 调用 约定 、 快 速 调用 约定 ， 以 及 使 用 MSVC 的 函数 
调用 约定 或 使 用 System-V 的 函数 调用 约定 。 当 然 ， 正 如 第 15 章 已 经 介绍 
的 ， 像 cdecl、stdcall 以 及 fastcall 这 三 种 调用 约定 都 只 能 用 于 x86 架 构 处 理 
器 的 32 位 执行 模式 下 。 而 ms_abi 与 sysv_abi 则 一 般 用 于 64 位 执行 模式 。 

正 因 GCC 可 同时 支持 ms_abi 与 sys_abi 这 两 种 调用 约定 ， 所 以 我 们 在 类 
Unix 系 统 环境 下 或 在 Windows 系 统 环 境 下 写 C 语 言 程序 都 能 具备 良好 的 
可 移植 性 ， 只 要 我 们 先 定好 两 者 都 采用 哪 一 种 调用 约定 即 可 。 





D.pure 


用 pure 属 性 修饰 的 函数 用 来 说 明 该 函数 除了 返回 值 之 外 没有 其 他 任 
何 效 果 ， 并 且 该 函数 所 返回 的 值 仅仅 依赖 于 函数 的 形 参 以 及 /或 全 局 对 


象 。 用 pure 属 性 所 修饰 的 函数 可 以 用 来 辅助 编译 器 做 消除 公共 子 表达 式 
以 及 帮助 做 循环 优化 ， 使 用 这 种 函数 就 好 比 使 用 算术 操作 符 一 般 。 


用 pure 属 性 所 修饰 的 函数 体内 不 应 该 含有 无 限 循环 ， 不 应 该 对 
Volatile 修饰 的 全 局 对 象 进行 访问 或 是 对 多 个 线程 所 共享 的 全 局 对 象 进行 
访问 ， 也 不 应 该 访问 其 他 系统 资源 ， 比 如 对 文件 、 套 接 字 等 进行 操作 。 
简 而 言 之 ， 对 同一 个 使 用 pure 属 性 修饰 的 函数 连续 做 两 次 调用 (如 果 该 

函数 带 有 参数 ， 那 么 两 次 调用 应 该 用 同样 的 实 参 ) ， 那 么 这 两 次 调用 所 
返回 的 结果 应 该 始终 是 相同 的 。 因 此 ， 用 pure 属 性 所 修饰 的 函数 也 很 容 
易 让 编译 器 做 内 联 处 理 。 代 码 清 单 17-19 展 示 了 pure 属 性 的 使 用 。 





代码 清单 17-19 pure 属 性 的 使 用 





#include <stdio.h> 


static int s = 10; 








/xx 以 下 定义 了 返回 类 型 为 void 的 pure 函 数 */ 
static void _attribute ((pure)) DummyFunc(void) 











puts("Hello, world!"); 


/** 以 下 定义 的 PureFunc 函 数 可 作为 pure 函 数 */ 


static int _ attribute ((pure)) PureFunc(int a, int b) 


return s+a*a+b™*b; 


Dy A 

* 以 下 定义 的 NormalFunc 不 能 作为 pure 函 数 ， 

* 因为 函数 内 对 全 局 对 象 进行 了 修改 ， 从 而 使 得 返回 结果 会 因为 不 同 的 全 局 对 象 的 值 而 导致 不 同 
*/ 

static int NormalFunc(int a, int b) 






























































s += 10; 
return s+a*a-b™* hb; 


int main(int argc, const char * argv[]) 
































// 各 位 注意 ，DummyFunc 在 这 里 不 会 被 调用 

















DummyFunc( ); 


int a = PureFunc(3, 4); 
int b = PureFunc(3, 4); 
































A/ 我 们 可 以 很 自然 地 知道 ， Ns oid 
printf("a = %d, b = %d\n a, b); 


a = NormalFunc(5， 0 

b = NormalFunc(5, 4); 

ZY NormalFunc 不 是 一 i Be 生效 W000 0 结果 也 是 不 同 的 
printf("a = %d, b = %d\n" b); 















































代码 清单 17-19 中 ，DummyFunc 是 一 个 pure 函 数 ， 但 返回 类 型 为 
void， 在 main 函 数 中 调用 时 由 于 编译 器 认为 它 对 于 程序 执行 不 会 造成 任 
何 影响 ， 所 以 把 它 直 接 给 消除 了 ， 我 们 在 运行 代码 清单 17-19 时 不 会 看 
到 “Hello，world! ”字符 串 的 输出 。 因 此 大 家 要 注意 的 是 ， 一 般 pure 函 
数 的 返回 类 型 不 应 该 是 一 个 void， 并 且 在 调用 时 应 该 总 是 要 有 个 对 象 去 
接收 其 返回 值 ， 人 否则 该 函数 的 调用 就 很 可 能 被 消除 。 另 外 ， 函 数 
NormalFunc 不 是 一 个 pure 函 数 ， 尽 管 我 们 使 用 _attribute _ 〈 (pure) ) 
对 它 进行 修饰 也 不 会 有 编译 报错 的 情况 ， 但 一 旦 编译 器 在 某 些 情况 下 把 
此 函数 误 做 优化 (比如 直接 将 它 所 访问 的 静态 对 象 s 的 访问 操作 优化 为 
直接 存放 在 某 个 寄存 器 中 ， 而 使 得 其 他 线程 对 此 修改 操作 不 可 见 ) ， 那 
么 执行 效果 与 我 们 的 预期 将 是 不 符 的 。 




















6.const 


用 const 属 性 修饰 的 函数 与 用 pure 属 性 修饰 的 十 分 类 似 ， 不 过 const 属 
性 比 pure 更 严格 ， 它 要 求 函 数 不 能 读 全 局 对 象 。 此 外 ， 用 const 属 性 修饰 
的 函数 的 参数 不 能 是 一 个 指针 类 型 ， 而 且 在 用 const 属 性 修饰 的 函数 内 往 


往 不 能 调用 一 个 非 const 属 性 的 函数 。 
7.constructor/destructor 


constructor 属 性 用 于 指定 一 个 函数 在 程序 进入 main 函 数 之 前 自动 被 
程序 加 载 器 调用 。 用 destructor 属 性 修饰 的 函数 则 是 在 main 函 数 执行 结束 
之 后 ， 或 是 调用 系统 退出 函数 exit 而 退出 当前 应 用 之 后 ， 由 系统 自动 调 
用 。 我 们 可 以 指定 多 个 constructor 函 数 以 及 destructor 函 数 ， 它 们 的 调用 
次 序 可 能 是 随机 的 。 不 过 我 们 可 以 为 它们 指定 优先 级 来 安排 它们 的 调用 
次 序 ， 带 有 优先 级 的 constructor 属 性 为 : constructor (priority) ; 带 有 优 
先 级 的 destructor 属 性 为 : destructor (priority) 。 这 里 的 priority 是 自己 指 
定 的 一 个 整数 ，priority 值 越 小 ， 那 么 其 优先 级 越 高 。 对 于 constructor 函 
数 来 说 ， 优 先 级 越 高 ， 那 么 就 越 先 被 执行 ， 对 于 destructor 函 数 来 说 ， 优 
先 级 越 高 则 越 晚 被 执行 


constructor 对 某 些 需要 做 全 局 初始 化 ， 但 又 无 法 直接 在 文件 作用 域 
通过 指定 常量 的 形式 做 初始 化 的 对 象 进 行 初始 化 来 说 非常 有 用 。 代 码 清 
单 17-20 展 示 了 constructor 了 水 数 与 destructor 函 数 的 用 法 。 


代码 清单 17-20 ”constructor 孙 数 与 destructor 函 数 的 使 用 





#include <stdio.h> 
#include <string.h> 


static int s = 10; 
static int array[10]; 


static int sum = 0; 


static void attribute ((constructor(1))) MyInit1(void ) 


{ 
puts("This is the first constructor!!"); 
// 给 array 静 态 数组 对 象 初始 化 
int tmp[] = {Ss, Ss + 1, s + 2}; 
memcpy(array, tmp, sizeof(tmp)); 

} 


static void _attribute ((constructor(2))) MyInit2(void) 


puts("This is the second constructor!!"); 
const int count = sizeof(array) / sizeof(array[0]); 


for(int i = 0; i < count; i++) 
sum += array[i]; 
} 
static void _attribute ((destructor(1))) MyDeinit1(void ) 
‘ 


puts("This is the second destrctor!!"); 


const int count = sizeof(array) / sizeof(array[0]); 
sum = 0; 


for(int i = 0; i < count; i++) 
sum += array[i]; 


printf("sum = %d\n", sum); 


static void _attribute ((destructor(2))) MyDeinit2(void) 
puts("This is the first destrctor!!"); 
// 将 array 数 组 对 象 全 都 清 零 


memset(array, ©0, sizeof(array)); 


} 
int main(int argc, const char * argv[]) 


printf("sum = %d\n", sum); 





我 们 执行 代码 清单 17-20 中 的 程序 之 后 就 能 很 清楚 地 看 到 两 个 
constructor 函 数 与 两 个 destructor 函 数 的 执行 次 序 了 。 


8.deprecated 


用 这 个 属性 来 修饰 函数 说 明 该 函数 已 经 被 废弃 了 ， 如 果 程 序 员 在 上 自 
己 的 函数 中 调用 此 函数 ， 那 么 编译 器 会 报 出 警告 。deprecated 属 性 还 能 


附加 自己 定制 的 消息 ， 形 式 为 : deprecated (message) 。 这 里 的 message 
是 一 个 C 语 言 字符 串 字 面 量 。 代 码 清单 17-21 展 示 了 deprecated 属 性 的 用 
法 ， 


代码 清单 17-21 deprecated 属性 的 使 用 





#include <stdio.h> 
static void _attribute ((deprecated)) MyFunc(void) 
puts("This is MyFunc!!"); 
static void 
_attribute __(( 
deprecated("Please use MyNewFunc instead") 


)) MyOldFunc(void) 


puts("This is MyOldFunc!!"); 


static void MyNewFunc(void) 


puts("This is MyNewFunc!"); 


int main(int argc, const char * argv[]) 











// 这 里 编译 器 会 报 出 警告 一 'MyFunc' is deprecated 
MyFunc( ); 


// 这 里 编译 器 会 报 出 警告 一 
// 'MyOldFunc' is deprecated: Please Use MyNewFunc instead 
MyOldFunc( ); 




















MyNewFunc( ); 





9.dllimport/dllexport 


这 两 个 属性 主要 用 于 Windows 系 统 以 及 塞 班 系统 ， 指 定 具 有 外 部 连 
接 的 函数 可 作为 动态 连接 库 的 符号 进行 导入 或 导出 。 
_ attribute _ 〈 (dllimnport) ) 相当 于 在 Windows 系 统 上 的 MSVC 编 译 器 


中 的 _declspec (dllimport) ，dllexport 属 性 也 一 样 。 详 细 可 参考 16.1.2 


节 内容 。 
10.naked 


这 个 属性 主要 用 于 ARM、x86_64、AVR 等 处 理 器 平台 。 默 认 情况 
下 ， 编 译 器 会 对 一 个 函数 实现 自动 生成 某 些 编译 器 既定 的 上 下 文保 护 与 
恢复 代码 ， 前 者 称 为 prologue， 后 者 称 为 epilogue。 当 用 了 此 属性 之 后 ， 
函数 实现 就 不 会 生成 prologue 以 及 epilogue 代 码 。 也 就 是 说 ， 用 此 属性 修 
饰 的 函数 对 于 我 们 来 说 就 是 一 个 纯粹 的 函数 入 口 ， 我 们 可 以 在 里 面 写 内 
联 汇编 ， 并 且 即 便 函 数 返 回 类 型 不 是 void， 我 们 也 无 需 自己 显 式 添加 
return 语 句 ， 直 接 用 汇编 指令 返回 即 可 。 另 外 ， 在 x86_64 环 境 下 ，naked 
函数 中 只 能 用 内 联 汇编 ， 而 不 能 使 用 其 他 C 语 言语 句 。 有 了 naked 函 数 ， 
我 们 就 可 以 直接 在 C 源 文件 里 写 汇编 代码 了 ， 而 且 用 内 联 汇编 实现 的 C 
函数 还 能 通过 内 联 等 处 理 做 进一步 的 优化 。 代 码 清单 17-22 展 示 了 naked 
函数 的 用 法 。 














代码 清单 17-22 naked 函数 的 用 法 





#include <stdio.h> 


/** 定义 一 个 naked 函 数 MyASMFunc， 该 函数 实现 100 + (a - b) 的 功能 */ 
static int _attribute ((naked)) MyASMFunc(int a, int b) 
{ 


int a = 90; // 在 naked 函 数 中 使 用 一 般 的 C 语 言语 句 是 错误 的 ， 
// 这 里 应 该 使 用 纯 内 联 汇 编 
asm("sub %esi, %edi"); 
asm("mov $100, %eax"); 
asm("add %edi, %eax" ); 


// 最 后 不 需要 return 语 句 ， 直 接 用 RET 指 令 做 函数 返回 即 可 













































































asm("ret"); 
int main(int argc, const char * argv[]) 


int a = 0 20); 
printf("a = %d\n a); 


各 位 要 注意 的 是 ， 大 家 要 执行 代码 清单 17-22 中 的 程序 时 必须 要 在 
Xx86_64 环 境 中 ， 因 此 需要 确保 当前 系统 是 64 位 系统 ， 并 且 编 译 恬 所 用 的 
输出 目标 是 64 位 程序 才能 正常 运行 








11.noinline 


此 属性 与 always_inline 相 反 ， 用 于 指明 一 个 函数 不 做 内 联 处 理 。 


12.nonnull 


此 属性 可 用 于 修饰 带 有 指针 类 型 形 参 的 函数 ， 指 明 该 函数 所 有 指针 
类 型 的 形 参 不 能 为 空 。 另 外 ， 我 们 也 可 以 使 用 nonnull Carg-index，.…) 
的 形式 来 指定 哪些 指针 对 象 的 参数 不 能 为 空 。 其 中 ，arg-index 的 最 小 值 
为 1， 所 以 计数 从 1 开始 ， 而 不 是 从 0 开始 。nonnull 这 个 属性 用 来 做 低层 
的 库 或 中 间 件 非常 有 用 ， 这 样 一 来 可 以 告诉 上 层 应 用 开 发 人 员 哪 些 参数 
古 不 能 为 空 的 ， 二 来 还 能 防止 上 层 应 用 开发 人 员 误 将 不 该 为 空 的 参数 传 
空 进 去 ， 人 否则 会 以 编译 器 警告 的 方式 呈现 出 来 。 代 码 清单 17-23 给 出 了 
nonnull 属性 的 使 用 方式 。 


代码 清单 17-23 ”nonnull 属 性 的 使 用 





#include <stdio.h> 


/** 定义 一 个 函数 MyFunc， 指 明 该 函数 的 所 有 指针 类 型 的 形 参 都 不 为 空 */ 
static int attribute__((nonnul1)) MyFunc(int *p) 





























‘ 
// 这 里 对 形 参 p 做 是 否 为 空 的 判断 会 引发 编译 器 警告， 
// 因为 该 参数 已 经 被 断言 不 能 为 空 了 
if(p == NULL) 
return 0; 
return *p + 10; 
} 






































/xx 这 里 定义 函数 MyFunc2， 并 且 指 明 其 第 一 个 形 参 p 不 能 为 空 */ 
static void _attribute (( nonnull(1) )) MyFunc2(int *p, int *q) 


) 
// 这 里 对 形 参 p 是 否 为 空 的 判定 会 引发 编译 器 警告 
if(p == NULL) 
return; 



























































th 


// 这 里 对 形 参 q 是 否 为 空 的 判定 不 会 引发 编译 器 警告 
if(q == NULL) 
* a 


p= 0; 





else 
"p="*q+1; 
} 
/** 这 里 定义 了 函数 MyFunc3， 并 指明 了 第 二 个 参数 与 第 四 个 参数 不 能 为 空 */ 
static void _attribute (( nonnull(2, 4) )) 
MyFunc3(int a, int *p, int b, int *q) 
{ 


} 


int main(int argc, const char * argv[]) 



































int a = 10; 
a = MyFunc(&a); 
printf("a = %d\n", a); 


// 这 里 如 果 传 空 来 调用 MyFunc 函 数 ， 那 么 编译 器 会 发 
int b = MyFunc(NULL ) ， 
printf("b = %d\n", b); 





























上 上 





MyFunc2(&b, &a); 
printf("b = %d\n", b); 


// 这 里 对 第 一 个 参数 传 空 会 引发 编译 器 警告 
MyFunc2(NULL, &a); 

// 这 里 对 第 二 个 参数 传 空 不 会 引发 编译 器 警告 
MyFunc2(&a, NULL); 

printf("a = %d\n", a); 

MyFunc3(a, &a, b, &b); 






































13.returns_nonnull 


该 属性 用 于 指明 它 所 修饰 的 的 返回 值 不 会 是 一 个 空 指针 。 


returns_nonnull 属 性 只 能 用 于 修饰 返回 类 型 为 一 个 指针 类 型 的 函数 。 它 
的 作用 与 nonnull 属 性 类 似 ， 一 般 用 于 告诉 上 层 应 用 开发 人 员 ， 当 前 函数 
的 返回 值 不 会 为 空 ， 因 此 不 需要 在 自己 函数 内 再 去 判定 调用 此 属性 修饰 
的 函数 之 后 的 指针 对 象 是 否 为 空 ， 从 而 使 代码 更 为 简洁 。 代 码 清单 17- 
24 展 示 了 returns_nonnull 属 性 的 使 用 示例 。 


代码 清单 17-24 ”returns_nonnull 属 性 的 使 用 





#include <stdio.h> 


static int s = 10; 





/** 定义 一 个 函数 MyFunc， 指 明 该 函数 的 返回 值 不 为 空 */ 
static int* _ attribute ((returns_ nonnull)) MyFunc(int *p) 


if(p == NULL) 
return &s; 


return p; 


int main(int argc, const char * argv[]) 


int a = 1; 
const int *p = MyFunc(&a); 
printf("*p = %d\n", *p); 


p = MyFunc(NULL); 
printf("*p = %d\n", *p); 





14.hot/cold: hot 


该 属性 用 来 告知 编译 器 ， 当 前 函数 属于 调用 比较 频繁 的 或 是 占用 系 
统 资 源 比较 高 的 ， 属 于 性 能 热点 (hot spot) ， 编 译 器 可 以 对 此 函数 做 深 
度 优化 。 而 cold 属 性 则 相反 ， 它 用 于 告诉 编译 器 ， 当 前 函数 很 少 执行 ， 
对 运行 性 能 影响 微乎其微 ， 编 译 避 可 将 它 安排 到 远离 热点 函数 的 子 代 人 码 








段 中 。 编 译 絮 将 所 有 热点 函数 安排 到 一 个 段 ， 将 所 有 冷 扩 代码 安排 到 一 
个 段 对 于 运行 时 性 能 的 影响 还 是 不 小 的 。 盛 其 是 当 我 们 做 高 性 能 计算 的 
时 候 ， 有 时 发 现 自 己 优化 了 一 个 函数 后 整体 性 能 反而 低 了 一 点 ， 这 很 可 
能 说 明 你 的 代码 改动 对 整个 程序 的 代码 结构 安排 造成 了 影响 ， 使 得 代码 
执行 时 对 指令 Cache 造 成 了 不 展 影 响 。 下 面 我 们 将 讨论 代码 段 这 个 话 


日 


识 。 
15.section: section 


该 属性 的 用 法 是 : section (“section-name”) 。 在 基于 GCC/Clang 编 
译 器 的 编译 工具 链 中 ， 会 将 编译 好 的 代码 放 入 text 段 。 然 而 ， 就 如 我 们 
上 面 第 14 条 中 所 提 及 的 ， 将 代码 完全 交 给 连接 器 安排 可 能 会 导致 几 个 调 
用 挨 得 比较 近 的 函数 被 安排 在 相互 离 得 较 远 的 地 址 位 置 ， 或 者 几 个 函数 
之 间 有 调用 关系 的 代码 可 能 被 隔 得 较 远 ， 这 会 导致 这 些 代 码 在 执行 时 造 
成 指令 Cache 命 中 率 低下 ， 从 而 影响 整体 程序 执行 性 能 。 为 了 避免 因 指 
令 Cache 的 命中 率 过 低 而 造成 程序 性 能 的 影响 ， 我 们 可 以 将 这 些 调用 挨 
得 比较 近 的 函数 ， 或 者 彼此 之 间 有 调用 关系 的 函数 安排 到 同一 个 段 中 。 
比如 像 : 











void funcA(void) 


funcB( ) ， 
funccC( ) 
funcD(); 


在 funcA 函 数 中 依次 调用 了 funcB、funcC 和 funcD， 那 么 我 们 可 以 将 
这 4 个 函数 安排 在 同一 个 代码 段 中 ， 或 者 将 funcB、funcC、funcD 安 排 在 
同一 个 代码 段 中 。 另 外 还 有 像 : 





void funcA(void) 


funcB( ) ， 


void funcB(void) 


funcc(); 


void funcC(void) 


funcD(); 





像 这 种 有 彼此 调用 关系 的 函数 可 以 看 情况 安排 在 同一 个 代码 段 。 这 
里 的 调用 关系 为 : funcA -funcB funcC funcD。 尤 其 在 同一 个 循环 里 
所 执行 的 一 些 函 数 放 在 同一 个 段 中 往往 会 有 比较 好 的 性 能 表现 。 


不 同 的 处 理 器 以 及 不 同 的 操作 系统 ， 对 于 子 段 的 定义 方式 可 能 不 
同 ， 代 码 清单 17-25 展 示 的 是 具有 mach-o 目 标 格式 的 macOS 系 统 下 的 子 
段 指 定 方式 。 


代码 清单 17-25 ”macOS 下 对 section 属 性 的 指定 





#include <stdio.h> 
static void _attribute (( section("_ _TEXT,MySection") )) MyFunci(void) 


puts("This is MyFunci!"); 


static void _attribute (( section(" _TEXT,MySection") )) MyFunc2(void) 


puts("This is MyFunc2!"); 


} 
static void Test(void) 


printf("MyFunci address: QOx%.16zX\n", (size_t)é&MyFunc1); 
printf("MyFunc2 address: QOx%.16zX\n", (size_t)é&MyFunc2); 
printf("Test address: %.16zX\n", (size t)&Test); 


} 
int main(int argc, const char * argv[]) 
{ 
MyFunc1( ) ， 
MyFunc2() ， 
Test(); 
printf("main address: %.16zX\n", (size_ t)&main); 
} 





在 代码 清单 17-25 中 ， 我 们 发 现 对 子 段 section 的 指定 必须 先 包含 一 个 
段 segment。 这 个 段 我 们 可 以 通过 对 当前 main.c 进 行 反 汇编 得 到 。 用 
Xcode 的 反 汇 编 见 图 17-1。 





Run Without Building 
Test Without Building 
Profile Without Building 


Test 

Test Again 
Profile 
Profile Again 


Compile “main.c” 
Analyze“main.c” 


jin{int argc, const char * a preprocess “main.c” 


上 Assemble “main.c” 

' 
tpg 
tr tp" Woh tp)? 


图 17-1 利用 Xcode 查询 当前 文件 的 反 汇编 








首先 在 当前 源 文件 的 编辑 状态 下 ， 在 沫 单 栏 选择 “Product"， 然 后 选 
中 “Perform Action”， 再 选择 “Assemble‘main.c*” 即 可 ， 然 后 就 会 跳 转 到 
main.c 源 文件 的 汇编 代码 界面 。 在 汇编 代码 界面 中 ， 我 们 看 到 了 第 一 行 
了 驶 是 : .section _ TEXT，_ text，regular，pure_instructions。 我 们 就 用 


_ TEXT 作为 Segment 名 即 可 。 


如 果 在 Linux 环 境 下 ， 我 们 可 以 通过 -S 命 令 选 项 来 输出 当前 C 源 文件 


对 应 的 汇编 文件 。 


代码 清单 17-25 中 ， 我 们 定义 了 名 为 MySection 的 子 段 。 通 过 输出 ， 
我 们 发 现 MyFuncl 与 MyFunc2 的 地 址 非常 接近 ， 而 没有 指定 子 段 的 Test 
与 main 函 数 的 地 址 则 非常 接近 。 在 笔者 测试 环境 下 ，myFunc1 的 地 址 为 
0x100004BF0; myFunc2 的 地 址 为 : 0x100004C10。Test 函 数 的 地 址 为 : 
0x1000008D0; main 函 数 的 地 址 为 : 0x100000890。 





16.used/unused 





unused 属 性 修饰 一 个 函数 意味 着 该 函数 很 可 能 不 会 在 整个 程序 中 调 
用 。 现 在 的 GCC 以 及 Clang 编 译 器 对 于 不 会 被 调用 到 的 函数 可 能 会 发 出 
编译 器 党 告 ， 如 果 我 们 对 该 函数 指明 了 unused 属 性 ， 那 么 编译 器 则 不 会 
再 报 出 警告 。 而 used 属 性 则 意味 着 该 函数 的 代码 必须 在 连接 时 生成 ， 它 
不 能 被 优化 掉 ， 无 论 该 函数 是 否 被 其 他 函数 调用 。 





17.visibility: visibility 





该 属性 用 于 指示 连接 器 当前 函数 符号 对 外 部 模块 的 可 见 性 ， 一 般 用 
于 动态 连接 库 的 制作 。visibility 属 性 的 声明 形式 为 visibility (“visibility- 
type”) ， 这 里 visibility-type 有 4 个 取 值 ， 分 别 为 default、hidden、 





protected 以 及 internal。 


(QDdefault 可 见 性 是 默认 的 符号 连接 可 见 性 ， 如 果 我 们 不 指定 


visibility 属 性 ， 那 么 默认 就 使 用 此 默认 的 可 见 性 。 默 认可 见 性 的 对 象 与 
函数 可 以 直接 在 其 他 模块 中 引用 ， 包 括 在 动态 连接 库 中 ， 它 属于 一 个 正 
常 、 完 整 的 外 部 连接 。 











Chidden 可 见 性 指明 了 它 所 修饰 的 对 象 和 函数 具有 "隐藏 连接 ”。 在 
同一 共享 目标 文件 〈.so 文 件 ) 中 ， 有 具有 隐藏 连接 的 一 个 对 象 或 函数 的 多 
声明 都 将 引用 同一 对 象 或 函数 。 











G)internal 可 见 性 与 hidden 可 见 性 类 似 ， 不 过 它 明 确 指示 连接 器 ， 
前 所 修饰 的 对 象 或 函数 不 能 在 其 他 模块 中 引用 。 不 过 根据 不 同 的 目标 文 
件 格式 ， 对 连接 属性 的 定义 可 能 会 有 些 送 异 ， 比 如 在 macOS 中 的 mach-O 
格式 的 目标 文件 而 言 ，hidden 可 见 性 同样 也 无 法 被 外 部 模块 所 引用 。 





(Dprotected 可 见 性 与 default 可 见 性 相 类 似 ， 不 过 该 可 见 性 指明 了 用 
它 所 修饰 的 对 象 或 函数 与 当前 模块 所 绑 定 ， 这 意味 着 该 对 象 或 函数 不 能 
被 男 一 模块 所 履 新 和 章 写 。 





下 面 ， 我 们 将 通过 代码 清单 17-26 与 代码 清单 17-27 来 观察 default 可 
见 性 、hidden 可 见 性 以 及 internal 可 见 性 在 macOS 系 统 上 的 效果 。 各 位 也 
可 以 根据 第 16 章 所 摘 述 的 内 容 在 Linux 系 统 上 进行 尝试 。 


代码 清单 17-26 ”macOS 中 对 可 见 性 属性 的 测试 (动态 库 的 代码 ) 


// 1ib2 
A 定义 hidden 可 见 性 的 函数 MyHiddenTest */ 
名 attribute ((visibility("hidden" a MyHiddenTest (void) 





return 100; 





/** 定义 internal 可 见 性 的 函数 internal */ 
int _ attribute ((visibility("internal"))) MyInternalTest(void) 


return 200; 


// lib.c 
#include <stdio.h> 




















节 
mT 





// 这 里 对 MyHiddenTest 与 MyInternalTest 函 数 的 声明 不 需要 显 式 地 添加 可 见 性 属性 
// 它们 引用 之 前 声明 过 的 相应 函数 


extern int MyHiddenTest(void); 

















extern int MyInternalTest(void); 

















/** 这 里 定义 默认 可 见 性 的 函数 MyExtDynFunc */ 
void MyExtDynFunc(void) 





puts("This is my so test!"); 


printf("hidden value: %d\n", MyHiddenTest()); 
printf("internal value: %d\n", MyInternalTest()); 


} 





代码 清单 17-26 展 示 了 两 个 源 文件 ， 一 个 是 lib2.c， 另 一 个 是 lib.c， 
另外 Xcode 工 程 名 用 的 是 mydyn， 编 译 构 建 后 最 终生 成 libmydyn.dylib。 
lib2.c 定 义 了 一 个 hidden 可 见 性 的 函数 MyHiddenTest， 一 个 internal 可 见 性 
的 函数 MyInternalTest。 然 后 在 lib.c 源 文件 中 对 它们 声明 以 及 调用 。 笔 者 
在 测试 的 时 候 将 最 后 生成 的 libmydyn.dylib 动 态 连接 库 文件 放置 在 
了 “Users/zennychen/ 用 户 根 目 录 下 。 各 位 可 以 根据 自己 当前 的 环境 来 
设置 存放 动态 库 的 路 径 。 








代码 清单 17-27 macOS 中 对 可 见 性 属性 的 测试 ( 主 函 数 ) 





// main.c 源 文件 
#include <stdio.h> 


// 此 头 文件 包含 了 运行 时 动态 加 载 动态 库 中 外 部 符号 的 API 
#include <dlfcn.h> 

















int main(int argc, const char * argv[]) 


const char *path = "/Users/zennychen/libmydyn.dylib"; 


// 使 用 dlopen 函 数 加 载 动态 库 ， 返 回 动态 库 文件 句柄 
void *dylibHandle = dlopen(path, RTLD_NOW); 
if(dylibHandle == NULL) 





















































{ 
puts("dylib file not found!"); 
return 0; 
} 
do 
{ 
// 使 用 dlsym 函 数 加 载 internal 函 数 符号 
int (*pFunc)(void) = dlsym(dylibHandle, "MyInternalTest"); 
if(pFunc == NULL) 
puts("MyInternalTest function not found!"); 
else 
{ 
int a = pFunc(); 
printf("a = %d\n", a); 
// 使 用 dlsym 函 数 加 载 hidden 函 数 符号 
pFunc = dlsym(dylibHandle, "MyHiddenTest"); 
if(pFunc == NULL) 
puts("MyHiddenTest function not found!"); 
else 
int a = pFunc(); 
printf("a = %d\n", a); 
// 使 用 dlsym 函 数 加 载 外 部 对 象 符号 
void (*p)(void) = dlsym(dylibHandle, "MyExtDynFunc"); 
if(p == NULL) 
puts("dyn_runtime object not found!"); 
break; 
p(); 
Uk 
while(false); 





// 关闭 动态 库 文件 句柄 
dlclose(dylibHandle); 








我 们 通过 运行 代码 清单 17-27 的 主 程序 之 后 就 会 发 现 ， 我 们 在 动态 
库 中 所 定义 的 hidden 可 见 性 的 函数 MyHiddenTest 以 及 internal 可 见 性 的 函 
数 MyInternalTest 都 无 法 在 main 函 数 中 加 载 。 我 们 只 能 加 载 到 默认 可 见 





性 的 MyExtDynFunc 函 数 。 
18.weak 


用 weak 属 性 修饰 的 具有 外 部 连接 的 对 象 或 函数 具有 一 个 弱 符 号 。 这 
意味 着 我 们 在 同一 模块 中 ， 或 者 在 为 一 模块 中 定义 相同 外 部 符号 名 的 对 
象 或 沙 数 ， 可 将 具有 weak 属 性 的 符 与 给 窗 六 重 写 。 这 对 我 们 制作 静态 连 
接 库 来 说 十 分 有 用 。 假 如 我 们 编写 了 一 个 静态 连接 库 A.a， 其 中 引用 了 
一 个 第 三 方 的 静态 连接 库 B.a， 而 最 终 应 用 开发 者 同时 引用 了 A.a 与 C.a， 
而 C.a 这 个 静态 连接 库 也 包含 了 B.a 的 内 容 ， 此 时 如 果 不 用 weak 属 性 修饰 
B.a 的 外 部 符 写 ， 那 么 束 会 引起 外 部 符 写 重 定 义 的 连接 时 错误 。 为 了 避 
免 引 及 重 复 包 含 的 错误 ， 将 外 部 符号 声明 为 weak 属 性 是 比较 可 靠 的 方 
式 。 





























此 外 ， 我 们 通过 weak 属 性 还 能 判定 当前 应 用 是 人 否 包含 了 指定 的 静态 
连接 库 。 比 如 ， 我 们 在 自己 的 应 用 中 用 weak 属 性 定义 某 个 需要 进行 判定 
的 外 部 函数 ， 如 果 我 们 的 应 用 包含 了 指定 的 静态 连接 库 ， 那 么 静态 连接 
库 中 非 weak 属 性 的 相同 外 部 符 写 将 窗 盖 我 们 应 用 里 自己 写 的 weak 属 性 
的 外 部 符号 ， 从 而 能 正常 发 挥 作用 。 而 如 果 没 有 使 用 相应 的 静态 连接 
库 ， 也 不 会 引发 外 部 符号 未 定义 的 错误 。 如 采 我 们 在 主 程序 中 含有 对 同 
一 图 数 名 包含 多 个 weak 属 性 的 外 部 符号 ， 并 且 没有 对 非 weak 属 性 的 相 
应 符号 进行 定义 ， 那 么 具体 使 用 哪个 符号 的 定义 将 由 连接 器 安排 选择 ， 
这 有 可 能 是 随机 的 。 但 如 条 有 一 个 相应 的 非 weak 属 性 的 符号 存在 ， 那 么 




















连接 器 必定 用 该 非 weak 属 性 的 外 部 符号 所 定义 的 内 容 。 


代码 清单 17-28 以 及 17-29 将 分 别 给 出 weak 属 性 外 部 符号 的 使 用 以 及 
效果 。 这 两 个 例子 都 是 在 ubuntu 16.04 中 完成 测试 的 。 


代码 清单 17-28 ”weak 属 性 的 使 用 (静态 库 代码 ) 








// 1libc.c 源 文件 
int _ attribute ((weak)) OverridenFunc(void) 


return 10; 


} 
const char *NonOverridenFunc(void) 


return "Hello"; 


} 


// 1ibc2.c 源 文件 
int _ attribute ((weak)) OverridenFunc(void) 


{ 


return 20; 


// build. sh 文件 
gcc -Std=gnu11 -c libc.c libc2.c 
ar cr libStaticTest.a libc.o libc2.0 





我 们 在 输入 代码 清单 17-28 中 的 代码 内 容 前 可 先 新 建 一 个 文件 夹 ， 
然后 分 别 创建 一 个 libc.c 源 文件 、libc2.c 源 文件 以 及 build.sh 文 件 。 这 里 大 
家 要 注意 的 是 ， 对 于 具有 相同 函数 名 的 不 同 weak 属 性 函数 的 定义 ， 必 须 
将 它们 放置 在 不 同 源 文件 中 ， 使 得 它们 有 具有 独立 的 翻译 单元 ， 从 而 拥有 
不 同 的 文件 作用 域 和 上 下 文 。 如 果 将 它们 放 在 同一 源 文件 中 ， 那 么 在 编 
译 时 就 会 报错 。 在 libc.c 与 libc2.c 中 分 别 定义 了 名 为 OverridenFunc 的 具有 
weak 属 性 的 函数 。 而 在 libc.c 源 文件 中 还 定义 了 一 个 具有 正常 外 部 连接 
的 函数 NonOverridenFunc， 它 的 实现 将 不 可 被 再 次 覆盖 。 














我 们 在 用 控制 台 进 入 该 工程 文件 夹 ， 然 后 输入 bash build.sh， 即 可 
编译 生成 静态 库 文件 libStaticTest.a 文 件 。 随 后 ， 我 们 将 这 个 静态 库 文件 
放 入 主 程序 的 项 目 文 件 夹 中 。 





代码 清单 17-29 ”weak 属 性 的 使 用 ( 主 程序 ) 





// main.c 源 文件 
#include <stdio.h> 





extern int OverridenFunc(void); 
const char* _attribute ((weak)) NonOverridenFunc(void) 


return NULL; 


int main(void) 


int a = OverridenFunc(); 
printf("a = %d\n", a); 


const char *s = NonOverridenFunc(); 
if(s == NULL) 


puts("Static library is not loded!"); 
return 0; 
printf("s = %s\n", s); 
} 


// build. sh 文件 
gcc main.c -Std=gnu11 -L./ -lStaticTest -0 CTest 








我 们 进入 主 程序 main.c 所 在 的 文件 严 ， 然 后 在 控制 台 输 入 bash 
build.sh， 即 可 编译 生成 最 终 的 CTest 可 执行 程序 。 我 们 运行 这 个 程序 之 
后 就 会 发 现 OverridenFunc 的 返回 结果 会 选择 libStaticTest.a 文 件 中 的 其 中 
一 个 ， 而 NonOverridenFunc 的 返回 将 始终 是 “Hello” 字 符 串 。 


如 果 各 位 在 macOS 坏 境 下 ， 那 么 需要 注意 的 是 ， 从 Xcode 8 开始 ， 
我 们 在 静态 库 工程 下 编译 ， 默 认 的 外 部 符 写 都 默认 为 weak 属 性 的 ， 即 便 








你 不 显 式 使 用 weak 属 性 也 是 如 此 。 因 此 这 会 使 得 我 们 做 静态 连接 之 后 ， 
即便 在 主 程序 中 定义 了 一 个 与 静态 库 中 相同 名 称 的 函数 都 不 会 有 任何 问 
题 ， 即 便 这 两 者 都 没 用 weak 属 性 去 显 式 修饰 。 





17.14.2 __attribute ”用 于 修饰 对 象 的 属性 


用 于 修饰 对 象 的 属性 与 用 于 修饰 函数 的 基本 差不多 ， 因 此 这 里 将 简 
略 介绍 ， 碰 到 与 函数 有 所 不 同 的 属性 将 会 做 详细 介绍 。 





1) aligned:， 与 用 于 修饰 函数 的 aligned 属 性 类 似 。 这 里 各 位 要 注意 
的 是 ，C11 标 准 所 引入 的 _Alignas 可 用 于 修饰 对 象 ， 因 此 我 们 最 好 用 
_Alignas 来 蔡 代 ， 这 样 对 于 可 移植 性 而 言 也 会 更 好 一 些 。 


2) deprecated: 与 用 于 修饰 函数 的 deprecated 属 性 类 似 。 


3) mode: 这 个 属性 用 于 指定 声明 一 个 对 象 的 数据 类 型 ， 对 于 声明 
一 个 整数 对 象 ， 如 果 通 过 mode 属 性 ， 那 么 我 们 都 只 需要 用 int 或 unsigned 
类 型 即 可 ， 然 后 该 属性 将 会 把 所 声明 的 对 象 转换 为 能 适应 该 模式 长 度 的 
相应 类 型 。GNU 语 法 扩展 支持 三 种 数据 类 型 模式 的 声明 ， 分 别 为 
mode (byte) ，mode (word) 以 及 mode (pointer) 。mode (byte) 表 
示 数 据 类 型 是 字 节 ， 往 往 对 应 char 类 型 ， mode (word) 表示 当前 处 理 器 
的 自然 字 长 ， 在 32 位 系统 中 一 般 为 4 个 字 节 ，64 位 系统 中 一 般 为 8 个 字 








节 ; mode (pointer) 表示 当前 处 理 器 环境 下 ， 一 个 指针 所 占 的 字 节 个 
数 。 代 码 清 单 17-30 将 展示 此 属性 的 使 用 与 效果 。 


代码 清单 17-30 ”对象 属性 mode 的 使 用 与 效果 





#include <stdio.h> 


#define OUTPUT_TYPE(expr) 


_Generic( (expr), \ 

signed char: puts("signed char"), \ 
unsigned char: puts("unsigned char"),\ 
signed short: puts("signed short"), \ 
unsigned short: puts("unsigned short"),\ 
signed int: puts("signed int"), \ 
unsigned int: puts("unsigned int"), \ 
signed long: puts("signed long"), \ 
unsigned long: puts("unsigned long"),\ 
signed long long: puts("sllong"), \ 
unsigned long long: puts("ullong"), \ 
default: puts("int")) 


int main(int argc, const char * argv[]) 


{ . 
// 声明 对 象 a， 将 它 类 型 指 


明 为 字 节 模式 


int _ attribute (( mode(byte) )) a = 100; 


// 声明 对 象 b， 将 它 类 型 指明 为 机 器 字 长 模式 
unsigned attribute (( mode(word))) b = 10000; 


// 声明 对 象 address， 将 它 类 型 指明 为 地 址 模式 
int _ attribute ((mode(pointer))) address ; 











address = (SIize_t)&ay， 


printf("a 
printf("b 





%d\n", *(char*)address); 
%tu\n", b); 


printf("size of a: %zu\n", sizeof(a)); 
printf("size of b: %zu\n", sizeof(b)); 
printf("size of address: %zu\n", sizeof(address)); 


OUTPUT_TYPE(a); 
OUTPUT_TYPE(b); 
OUTPUT_TYPE(address); 





4) packed: packed 属 性 可 用 于 修饰 一 个 一 般 对 象 ， 也 可 用 于 修饰 结 
构 体 或 联合 体内 的 成 员 对 象 ， 用 于 指示 该 对 象 应 该 具有 最 小 可 能 的 字 贡 
对 齐 。 对 于 一 个 普通 对 象 可 能 是 一 个 字 节 ; 对 于 一 个 结构 体 中 的 位 域 ， 








则 可 能 是 一 个 比特 。 如 果 我 们 同时 用 aligned 属 性 或 _Alignas 来 修饰 同一 





对 象 ， 那 么 该 对 象 的 字 市 对 齐 将 按照 aligned 属 性 来 安排 。 代 人 码 清单 17- 


31 展 示 了 packed 属 性 的 使 用 。 


代码 清单 17-31 ”对象 属性 packed 的 使 用 





#include <stdio.h> 
#include <stdint.h> 
#include <stdalign.h> 
#include <stddef.h> 


struct Test 


int8_t a; 


// 如 果 仅仅 对 一 个 对 象 声 明 ，__attribute 可 以 放 到 声明 尾 

















// 这 里 的 成 员 b 为 1 个 字 节 对 齐 


int b _attribute ((packed)); 


int16_t c; // 成 员 c 为 2 个 字 节 对 齐 


uint8_t d; 


// 这 里 的 成 员 e 为 1 个 字 节 对 齐 

















int64 t _attribute ((packed)) e; 














nk 
a 


};// Test 结 构 体 最 后 以 这 里 字 节 对 齐 数 最 大 的 2 作为 最 终 大 小 的 倍数 ， 所 以 最 后 填充 了 1 个 字 节 





int main(int argc, const char * 


int _ attribute ((packed)) 
int _ attribute ((packed)) 


printf("align of a: %zu\n", 
printf("align of b: %zu\n", 


argv[]) 
a = 100; 


alignas(long) b = 20,; 


alignof (a)); 
alignof(b)); 


printf("size of Test: %zu\n", sizeof(struct Test)); 














// 各 位 可 以 通过 以 下 成 员 的 偏 移 地 址 就 能 观察 到 各 成 员 的 字 


























printf("offset of a: %zu\n", 
printf("offset of b: %zu\n", 
printf("offset of c: %zu\n", 
printf("offset of d: %zu\n", 
printf("offset of d: %zu\n", 





offsetof(struct 
offsetof(struct 
offsetof(struct 
offsetof(struct 
offsetof(struct 


节 对 齐 情 况 了 


Test, a)); 
Test, b)); 
Test, c)); 
Test, d)); 
Test, e)); 





这 里 各 位 要 注意 的 是 ， 在 GCC 更 高 版 本 以 及 Clang 编 译 器 中 ， 对 一 
般 对 象 声 明 packed 属 性 将 可 能 会 被 忽略 。 而 在 结构 体 中 对 成 员 对 象 进 行 


声明 则 没有 问题 。 





5) section: 用 于 修饰 对 象 的 section 属 性 与 用 于 修饰 图 数 的 类 似 ， 可 
参考 用 于 修饰 函数 的 介绍 。 


6) used/unused: 用 于 修饰 对 象 的 used/unused 属 性 与 用 于 修饰 函数 
的 类 似 ， 可 参考 用 于 修饰 函数 的 介绍 。 


7) weak: 用 于 修饰 对 象 的 weak 属 性 与 用 于 修饰 函数 的 类 似 ， 可 参 
考 用 于 修饰 函数 的 介绍 。 


8) dllimport/dllexport: 用 于 修饰 对 象 的 dlimport/dllexport 属 性 与 用 
于 修饰 函数 的 类 似 ， 可 参考 用 于 修饰 函数 的 介绍 。 


17.14.3 ”attribute ”用 于 修饰 类 型 的 属性 


attribute ”也 可 用 于 修饰 结构 体 、 联 合体 以 及 枚 举 类 型 (有些 还 
能 用 于 修饰 枚 举 常 量 ) 。 用 于 修饰 类 型 的 属性 与 用 于 修饰 函数 和 对 象 的 
也 基本 差不多 。 因 此 这 里 将 简略 介绍 ， 碰 到 与 函数 或 对 象 有 所 不 同 的 属 
性 将 会 做 详细 介绍 。 


1) aligned: aligned 属 性 与 用 于 修饰 函数 的 类 似 ， 详 细 可 参考 函数 
属性 部 分 。 此 属性 可 以 用 来 修饰 枚 举 、 结 构 体 、 联 合体 以 及 类 型 定义 。 
当然 ， 最 大 可 能 的 对 齐 字 节 数 最 终 还 是 得 看 连接 器 ， 如 果 超 过 了 连接 器 
所 能 支持 的 对 齐 字 市 数 ， 则 以 连接 絮 的 最 大 字 节 对 齐 数 进行 安排 。 代 码 

















清单 17-32 展 示 了 aligned 属 性 修饰 用 户 自 定义 类 型 的 示例 。 


代码 清单 17-32 ”aligned 属 性 修饰 用 户 自 定义 类 型 





#include <stdio.h> 
#include <stdalign.h> 


// 定义 MyStruct， 将 它 声明 为 8 字 节 对 齐 
// _ attribute __ 修饰 一 个 用 户 自 定义 类 型 时 ， 可 以 放 在 类 型 声明 的 末 
struct MyStruct 





























eal 

















Short a, b; 
} _attribute ((aligned(8))); 


// 定义 MY_ENUM 枚 举 类 型 ， 将 它 声明 为 8 字 节 对 齐 
enum _ attribute ((aligned(8))) MY_ENUM 





MY_ENUM_ONE, 
MY_ENUM_TWO 
}; 




















节 对 齐 属 性 用 于 修饰 typedef 名 
Se int MY_INT _attribute ((aligned(8))); 
typedef short _attribute ((aligned(4))) MY_SHORT; 











int main(int argc, const char * argv[]) 


























































































































{ 
// MyStruct 结 构 体 由 于 8 字 节 对 齐 ， 所 以 最 终 大 小 必须 是 其 自身 字 节 对 齐 的 倍数 。 
// 原本 MyStruct 为 4 个 字 节 ， 这 里 需要 在 最 后 做 4 个 字 节 的 字 节 填充 ， 扩 充 到 8 字 节 
printf("The size of MyStruct: %zu\n", sizeof(struct MyStruct)); 
enum MY_ENUM me = MY_ENUM_TWO,; 
// 这 里 MY_ENUM 枚 举 对 象 me 仍然 为 4 个 字 节 
printf("size of me: %zu\n", sizeof(me)); 
// 不 过 这 里 MY_ENUM 枚 举 对 象 me 为 8 字 节 对 齐 
printf("align of me: %zu\n", alignof (me)); 
printf("align of MY_INT: %zu\n", alignof (MY_INT)); 
printf("align of MY_SHORT: %zu\n", alignof (MY_SHORT)); 

} 





2) packed: 这 里 对 类 型 使 用 packed 属 性 时 ， 可 以 针对 结构 体 与 联合 
体 类 型 ， 效 果 与 用 于 修饰 对 象 的 类 似 。 


3) unused: 这 个 属性 与 用 于 修饰 函数 和 对 象 的 类 似 ， 详 细 请 参考 
修饰 函数 的 unused 属 性 。 


4) deprecated: 这 个 属性 与 用 于 修饰 函数 和 对 象 的 类 似 ， 详 细 请 参 
考 修 饰 函 数 的 deprecated 属 性 。 男 外 ， 从 GCC 4.9 以 及 Clang 3.6 起 ， 
deprecated 可 单独 用 于 修饰 一 个 枚 举 常量 。 


17.15 ”本章 小 结 


本 章 主要 介绍 了 主要 的 一 些 GNU 扩 展 语法 特性 ， 这 些 语 法 特性 可 以 
在 GCC 4.9 或 更 高 版 本 以 及 Clang 3.8 及 更 高 版 本 上 进行 使 用 。 由 于 目前 
大 部 分 主流 更 面 编译 器 以 及 磐 入 式 系统 编译 器 都 基于 GCC 与 Clang 编 译 
器 的 核心 ， 所 以 其 适用 范围 相当 广泛 。 同 时 ，GNU 语 法 扩展 也 是 针对 C 
语言 相当 好 的 语法 体系 的 补充 ， 增 加 了 其 体系 的 完备 性 。 可 以 说 ， 有 了 
GNU 语 法 扩展 ，C 语 言 才能 真正 算是 一 门 现代 化 的 高 级 编程 语言 。 





第 18 间 ”Clang 编 译 器 对 C11 标 准 的 扩展 





第 17 章 给 大 家 描述 了 GNU 语 法 扩展 ， 这 些 扩展 可 以 给 GCC 和 Clang 
虽 译 器 以 及 基于 这 些 编译 器 核心 打造 出 来 的 编译 工具 链 进行 使 用 。 而 本 
章 将 为 大 家 介绍 当前 最 为 先进 的 LLVM Clang 编 译 器 针对 C11 语 法 扩展 特 





Ep 


床 


单独 针对 Clang 编 译 器 做 介绍 也 是 有 很 多 缘由 的 。 首 先 ，Clang 编 译 
器 是 整个 LLVM 项 目的 一 个 子 项 目 ， 它 是 C、C++ 以 及 Objective-C 编 程 语 
言 的 编译 嚣 前端。 而 整个 LLVM 项 目 采 用 的 是 UIUC 许 可 证 、 基 于 
MIT/X11 许 可 证 以 及 3 条 球 的 BSD 许 可 证 。 这 个 许可 证 比 起 GCC 的 著名 
GPL 许 可 证 要 宽松 很 多 。 这 意味 着 我 们 直接 获取 Clang 的 源 代 码 ， 然 后 
可 以 根据 自己 当前 的 目标 平台 做 适 配 ， 而 经 过 修改 的 代码 部 分 则 无 需 开 
放出 来 ， 这 一 点 在 GPL 许可 证 上 是 不 允许 的 。 正 因为 如 此 ， 它 广 受 各 大 
厂商 的 欢迎 。 而 且 LLVM 项 目 最 初 由 Swift 编 程 语言 创始 人 Chris Lattner 
在 大 学 里 发 起 ， 然 后 被 Apple 看 中 ，Apple 在 LLVM 上 做 了 大 力 投资 ， 后 
来 又 开启 了 自己 的 一 个 分 支 ， 称 为 Apple LLVM。 因 此 我 们 现在 从 Xcode 
4 开始 起 用 的 LLVM 编 译 器 都 称 为 Apple LLVM 编 译 器 ， 而 Apple LLVM 
编译 器 义 是 从 标准 的 LLVM 主 干 上 拉 下 来 的 。 























此 外 ，Google 也 是 从 NDK 9 开始 起 大 力 推 广 LLVM Clang 编 译 工 具 


链 。 而 且 在 NDK 11 中 就 有 官方 声明 ，GCC 编 译 器 只 升级 到 4.9， 后 续 将 
处 于 维护 状态 ， 然 后 NDK 13 版 本 将 直接 被 丢弃 ， 而 只 使 用 LLVM Clang 
编译 工具 链 。 再 看 看 ARM，ARM 官 方 的 编译 工具 链 ARM Studio 6 也 开 
始 基 于 Clang。 而 像 AMD 则 是 把 Clang 直 接 用 于 自己 的 OpenCL 编 译 器 
2 





到 了 2017 年 ， 微 软 也 将 Clang 集 成 在 Visual Studio 开 发 环境 中 ， 作 为 
可 选 的 C 语 言 编译 器 前 疾 ， 而 后 端 仍然 采用 MSVC 的 目标 代码 生成 器 以 
及 运行 时 。 





可 见 ，Clang 作 为 C 语 言 的 编译 器 前 端 已 经 被 炒 得 如 此 狂热 了 。 对 于 
我 们 开发 者 来 说 ， 如 果 当 前 在 做 iOS 以 及 Android 应 用 开发 ， 那 么 请 别 犹 
了 瑰 ， 直 接 使 用 Clang 编 译 器 《当然 ， 这 也 没 得 选 ) ， 使 用 它 的 语法 扩展 
吧 。 而 且 在 macOS、iOS、watchOS 以 及 tvOS 的 开发 框架 中 ， 已 经 有 不 
少 API 都 直接 使 用 了 Clang 语 法 扩展 ， 比 如 后 面 会 讲 到 的 Blocks 语 法 。 这 
些 在 Android 开 发 上 也 都 能 使 用 ， 后 面 会 进行 介绍 。 





如 有 果 我 们 使 用 了 Clang 编 译 器 ， 那 么 编译 器 就 会 自动 定义 预 编译 宏 
_ clang_， 表 示 当 前 用 的 是 Clang 或 基于 Clang 的 编译 工具 链 。 此 外 ， 
_GNUC_ 这 个 预 编译 宏 也 会 被 定义 ， 说 明 当 前 编译 器 遵循 GNU 语 法 扩 
展 。 


18.1 特征 检查 宏 








特征 检查 宏 是 一 组 用 于 检查 当前 Clang 编 译 器 是 否 具有 某 些 语法 特 
性 或 是 否 支持 指定 的 内 建 函 数 的 宏 ， 这 些 宏 都 以 两 条 下 划 线 打头 。 比 
如 ， 像 has_builtin 用 于 检查 当前 Clang 编 译 器 是 否 支持 指定 的 内 建 函 
数 。_has_feature 与 “has_extension 这 两 个 宏 用 得 较 多 ， 用 于 检查 当前 
编译 器 是 否 支 持 所 指定 的 语法 特征 。_has_attribute 则 用 于 检查 当前 编译 
器 是 否 支 持 所 指定 的 属性 。 另 外 还 有 _has_include 宏 则 用 于 检查 当前 上 
下 文中 是 否 包 含 了 所 指定 的 文件 。 关 于 特征 检查 这 个 语法 特性 ， 其 内 容 
比较 繁杂 ， 但 同时 语法 却 比 较 简 单 ， 各 位 可 以 参考 这 个 网 页 上 的 内 


zz 


容 : http://cdlang.llvm.org/docs/LanguageExtensions.html。 











18.2 _Nullable 与 Nonnull 


Clang 编 译 器 当然 也 支持 GUN 语法 扩展 中 的 nonnull 属 性 ， 但 是 对 于 
每 个 需要 指定 函数 形 参 不 能 为 空 的 参数 都 要 用 
_ attribute _ 〈 (nonnul) ) 去 修饰 显然 太 过 繁琐 ， 而 且 使 得 代码 也 显 
得 比较 见长 。 而 在 Clang 编 译 器 中 ， 则 直接 引入 了 _Nullable (前 面 带 有 
一 条 下 划 线 ) 限定 符 用 于 修饰 指针 类 型 的 函数 形 参 对 象 可 以 为 空 ， 用 
_Nonnull (前 面 带 有 一 条 下 划 线 〉 限定 符 用 来 表示 当前 所 修饰 的 指针 类 
型 的 形 参 对 象 不 可 为 空 。 此 外 ， 这 两 个 关键 字 还 能 用 于 修饰 函数 的 返回 
类 型 ， 如 果 函 数 返 回 类 型 为 指针 类 型 的 话 。 引 入 这 两 个 限定 符 一 来 是 提 
高 代码 的 简洁 性 ， 尽 管 我 们 也 可 以 自己 定义 宏 用 来 简化 
_attribute _〈( (nonnull) ) ; 二 来 是 为 了 能 更 好 地 将 我 们 用 C 语 言 定义 
的 外 部 全 局 函数 输出 给 其 他 编程 语言 进行 使 用 ， 比 如 Swift。 像 Swift 这 
种 编程 语言 有 Optional 语 法 特性 ， 需 要 指明 当前 函数 形 参 是 否 可 以 为 
空 ， 如 果 不 能 为 空 ， 我 们 必须 使 用 Nonnull 限 定 符 来 修饰 该 形 参 指针 对 
象 。 























另外 各 位 要 注意 的 是 ，Apple 在 Apple LLVM 6.0 中 就 引入 了 
_nonnull 与 _nullable， 这 两 者 都 还 能 使 用 ， 但 推荐 使 用 Clang 标 准 化 的 
_Nonnull 与 _Nullable， 它 俩 在 其 他 基于 Clang 编 译 占 前 端的 编译 工具 链 上 
也 能 使 用 。 代 码 清单 18-1 展 示 了 _Nullable/_Nonnull 属 性 的 使 用 。 


代码 清单 18-1 _Nullable/ Nonnull 属 性 的 使 用 





#include <stdio.h> 
static void MyFunc(int* _Nonnull p, int* _Nullable 9q) 


if(p == NULL) 
return; 


if(q 1= NULL) 
*p = *q; 
else 
“p= 0; 


int main(int argc, const char * argv[]) 


int a = 10, b = 20; 


MyFunc(&a, &b); 
printf("a = %d, b = %d\n", a, b); 


// 如 果 第 一 个 参数 传 空 ， 那 么 编译 器 会 发 出 警告 
MyFunc(NULL, NULL); 


// 由 于 第 二 个 参数 可 以 为 空 ， 所 以 这 个 调用 不 会 有 任何 警 
MyFunc (&a, NULL ) ， 
printf("a = %d\n", a); 















































代码 清单 18-1 中 ， 函 数 MyFunc 具 有 两 个 指向 int 类 型 的 指针 参数 p 和 
qd。 其 中 形 参 p 用 _Nonnull 修 饰 ， 生 命 表 示 它 不 能 为 空 ， 形 参 q 用 _Nonnull 
修饰 ， 声 明 它 可 以 为 空 。Clang 编 译 器 会 在 编译 时 做 静态 代码 分 析 ， 如 
果 在 调用 MyFunc 时 ， 将 空 (NULL) 传递 给 形 参 p， 那 么 编译 器 就 会 发 
出 警告 。 


18.3 ”函数 重 载 











函数 重 载 是 一 个 融 级 编程 语言 常用 特性 ， 现 在 很 多 避 级 编程 语言 都 
支持 该 语法 特性 ， 包 括 Ct++、Java、C#、Swift， 等 等 。 那 么 什么 是 函数 
重 载 呢 ? 简单 来 说 ， 就 是 在 同一 单元 翻译 中 定义 了 一 组 相同 名 称 的 函 
数 ， 这 些 函 数 具 有 不 同 的 参数 类 型 或 参数 个 数 ， 那 么 我 们 称 这 组 函数 为 
重 载 浮 数 (overloaded functions) 。 倘 大 这 组 函数 中 有 任意 两 个 函数 的 
参数 类 型 与 个 数 都 完全 相同 ， 那 么 编译 器 仍然 会 报 有 类 型 冲突 的 错误 。 








Clang 中 通过 使 用 _attribute 〈 (overloadable) ) 这 一 函数 属性 说 
明 符 将 一 个 函数 指示 为 可 重 载 的 。 各 位 要 注意 的 是 ， 对 于 一 组 重 载 函 
数 ， 我 们 需要 将 它们 每 一 个 都 用 _attribute 〈 (overloadable) ) 函数 
说 明 符 进行 修饰 ， 如 果 漏 了 一 个 ， 那 么 那个 函数 将 会 报 出 类 型 冲突 的 错 
误 。 下 面 通过 代码 清单 18-2 来 给 大 家 展示 一 下 函数 重 载 的 表现 方式 。 








代码 清单 18-2 ”Clang 编 译 器 中 使 用 函数 重 载 特性 





#include <stdio.h> 
static void _attribute ((overloadable)) Func(void) 


puts("This is a function!"); 


static void _attribute _((overloadable)) Func(int a) 


printf("a = %d\n", a); 


static void _attribute ((overloadable)) Func(float f) 


printf("f = %f\n", f),; 


} 


static void _attribute ((overloadable)) Func(char c) 


printf("The character is: %c\n", c); 


static void _attribute ((overloadable)) Func(unsigned a, short b) 


printf("The sum is: QOx%.8X\n", a + b); 


De 

* 这 个 函数 会 报 类 型 冲突 的 错误 ， 因 为 它 与 第 一 个 Func 一 样 ， 形 参 列表 为 空 ， 
* 即便 它 的 返回 类 型 与 第 一 个 Func 有 所 不 同 

YX 






































static int _ attribute ((overloadable)) Func(void) 


return 10; 


int main(int argc, const char * argv[]) 











// 这 里 调用 的 是 void Func(void) 函 数 
Func( ) ; 

















// 这 里 调用 的 是 void Func(int al) 函 数 
Func(100 ) ， 



































// 这 里 调用 的 是 void Func(float 下 ) 函 数 
Func(10.25f); 




















// 各 位 注意 ， 这 里 调用 的 也 是 void Func(int al) 函 数 ， 
// 因为 之 前 我 们 已 经 讲 到 了 ，C 语 言 中 像 'c ' 这 种 字符 字面 量 默认 为 Int 类 型 












































对 'c 做 了 char 类 型 的 投射 操作 之 后 ， 也 就 将 int 类 型 转换 为 了 char 类 型 ， 
十 调 用 的 就 是 void Func(char c) 函 
Func((char)'c'); 



































// 调用 了 void Func(int a，short b) 函 数 
Func(9xcgde0000， 0Xx1314 ) 





通过 代码 清单 18-2 我 们 发 现 ， 使 用 函数 重 载 将 会 使 得 函数 接口 变 得 

十 分 简洁 。 对 于 实现 相同 功能 的 函数 ， 我 们 无 需 通过 改变 函数 名 就 能 给 
不 同类 型 的 参数 或 者 不 同 个 数 的 参数 做 相应 的 函数 调用 了 。 我 们 在 使 用 
具有 函数 重 载 特性 的 一 组 函数 时 需要 注意 ， 像 代码 清单 18-2 中 所 示 的 ， 
如 果 我 们 要 传 的 一 些 实 参 的 类 型 与 想 要 调用 的 那个 函数 的 形 参 类 型 不 匹 
么 我 们 此 时 需要 使 用 类 型 投射 操作 ， 将 实 参 类 型 显 式 地 转换 为 相 











应 函数 的 形 参 类 型 ， 否 则 可 能 会 调用 到 我 们 本 不 想 调 用 的 那个 函数 。 


18.4 ”Blocks 语 法 


Blocks 语 法 是 Apple 在 Apple LLVM 2.0 中 贡献 给 LLVM 开 源 社 区 的 C 
语言 扩展 语法 特性 。 这 里 的 Blocks 不 是 指 我 们 C 语 言 中 的 语句 块 ， 而 是 
一 种 Lambda 表 达 式 ， 由 于 它 可 以 像 语 句 块 那样 定义 在 函数 体内 ， 所 以 
将 此 语法 命名 为 Blocks。 为 了 避免 泥 消 ， 后 续 提 及 到 Blocks 语 法 时 一 律 
用 Blocks 英 文 给 出 ， 而 对 于 普通 语句 块 ， 则 直接 称 其 为 “语句 块 ”。 


在 开讲 Blocks 语 法 之 前 ， 我 们 首先 简单 介绍 一 下 两 个 基本 概念 ， 一 
个 是 Lambda 表 达 式 〈Lambda 是 希腊 字母 A) ， 还 有 一 个 是 闭 包 
(Closure) 。 


在 计算 机 编程 领域 Lambda 表达 式 也 称 作 为 匿名 函数 ， 它 可 以 像 
函数 那么 定义 ， 也 可 以 做 函数 调用 ， 但 不 需要 给 出 函数 名 。 在 计算 机 编 
程 语言 领域 中 ， 闭 包 也 称 为 词法 闭 包 〈lexical closure) 或 函数 闭 包 
(function closure) ， 在 具有 头等 函数 的 编程 语言 〈 主 要 是 函数 式 编程 
语言 ) 中 用 于 实现 词法 作用 域 的 名 字 绑 定 〈lexically scoped name 
binding) 。 在 操作 上 ， 闭 包 是 一 条 记录 ， 它 将 一 个 函数 与 它 自 己 的 上 下 
文 存 放 在 一 起 。 当 我 们 在 某 一 个 函数 里 创建 闭 包 的 时 候 ， 此 闭 包 将 该 函 
数 中 每 一 个 与 自己 相关 联 的 局 部 对 象 映射 为 自己 所 绑 定 的 名 字 。 








至 此 我 们 可 以 看 到 ， 一 个 Lambda 表 达 式 如 果 可 作为 闭 包 ， 那 么 必 


须 满足 两 个 条 件 : 第 一 ， 它 能 绑 定 自己 所 在 函数 的 局 部 对 象 ， 第 二 ， 它 
必须 有 上 自己 独立 的 执行 环境 ， 使 得 所 绑 定 的 局 部 对 象 能 始终 在 其 目 己 的 
执行 环境 中 维护 ， 这 一 点 也 古 判 定 一 个 Lambda 表 达 式 是 人 否 可 作为 财 包 
的 最 为 关键 的 一 点 。 根 据 这 两 个 条 件 ， 我 们 可 以 得 出 ， 像 Java 8 中 的 匿 
名 Lambda 表 达 式 严格 意义 上 不 属于 闭 包 ， 因 为 它 对 目 己 所 绑 定 的 局 部 
对 象 的 维护 特性 非常 薄弱 ， 它 只 能 绑 定 常量 ， 而 不 能 绑 定 变量 ， 并 且 还 
有 其 他 许多 约束 。 而 C++11 的 Lambda 表 达 式 自身 也 不 具备 保存 自己 执行 
环境 的 接口 ， 只 能 通过 借助 std: : function 做 Lambda 表 达 式 执行 环境 的 
找 贝 与 封装 ， 这 样 才 能 把 Lambda 表 达 陈 找 贝 到 函数 外 执行 。 我 们 后 面 
可 以 看 到 ，Clang 中 的 Blocks 语 法 就 是 相当 标准 的 闭 包 。 

















下 面 我 们 将 引入 Blocks 引 用 类 型 以 及 Blocks 定 义 的 语法 形式 ， 同 时 
我 们 也 将 结合 上 面 涉 及 的 一 些 术 语 做 更 明了 的 介绍 。Blocks 的 引用 类 型 
与 函数 指针 类 型 十 分 类 似 ， 我 们 只 需要 把 函数 指针 类 型 中 的 * 符 号 改 为 ^ 
符号 即 可 。 比 如 ， 我 们 声明 一 个 指向 函数 的 指针 对 象 ， 像 
void (*pFunc) (int) ; 表示 声明 一 个 函数 指针 对 象 pFunc， 它 所 指向 
的 函数 类 型 为 void (int) 。 而 如 果 是 一 个 Block 引 用 对 象 的 声明 也 类 
似 : void (^refBlock) (int〉 ; 表示 声明 了 一 个 对 Block 的 引用 对 象 ， 它 
所 引用 的 Block 类 型 为 void (^) (int) 。 从 上 面 这 两 句 话 中 我 们 就 可 以 
看 到 一 个 Block 引 用 类 型 与 指向 函数 指针 类 型 的 形式 十 分 相似 。 而 定义 
一 个 类 型 为 void (^) (int) 的 Block 可 以 如 下 : Avoid (inta) 


{Printf (“a=%dn”，a) ; }; 是 非常 简单 。 这 个 Block 的 返回 类 型 为 








void， 并 且 含 有 一 个 int 类 型 的 参数 。 从 对 Block 的 定义 上 我 们 也 可 以 看 
到 ，Block 上 自身 是 没有 标识 符 的 ， 它 就 是 一 个 纯粹 的 表达 式 。 








我 们 将 通过 代码 清单 18-3 来 介绍 上 面 提 到 的 一 些 术语 。 不 过 在 此 之 
前 ， 如 果 各 位 是 在 Debian/Ubuntu 系 统 上 编程 的 话 ， 那 么 可 以 通过 在 命令 
行 输入 以 下 命令 来 安装 Clang 以 及 使 用 Blocks 和 Grand Central Dispatch 所 





sudo apt-get install llvm 

sudo apt-get install clang 

sudo apt-get install libblocksruntime-dev 
sudo apt-get install libdispatch-dev 





第 三 条 命令 可 以 先 不 用 输入 ， 因 为 Clang 本 身 所 带 的 一 些 库 可 能 
经 包含 了 Blocks 的 运行 时 。 如 果 我 们 在 使 用 Blocks 时 发 生 了 连接 错误 ， 
那么 可 以 安装 blocksruntime-dev。 另 外 ， 我 们 在 Windows 以 及 除了 
macOS/iOS 以 外 的 类 Unix 系 统 环境 下 通过 Clang 来 编译 使 用 Blocks 的 C 代 
码 的 时 候 ， 必 须 使 用 -fblocks 编 译 命令 选项 ， 指 示 编 译 器 开启 Blocks 语 
法 ， 然 后 使 用 -lBlocksRuntime 命 令 选项 来 连接 Blocks 所 需要 的 运行 时 
库 。 如 果 我 们 还 想 使 用 Grand Central Dispatch， 则 再 添加 -ldispatch 命 令 
选项 。 而 在 macOS 中 ，Xcode 己 经 帮 我 们 做 了 一 切 ， 我 们 只 需要 直接 点 
击 三 角 箭 头 按钮 编译 构建 即 可 。 如 有 果 各 位 用 的 是 windows 和 Android， 那 
么 可 以 从 这 个 地 址 下 载 到 blocksruntime-dev 的 源 代 码 ， 然 后 可 以 自己 做 
成 库 或 是 直接 将 源 代码 放 入 自己 的 项 目 工程 
中 : https://github.com/mackyle/blocksruntime。 这 个 项 目 基于 UIUC 与 








MIT 双 重 许可 证 ， 各 位 可 以 放心 大 胆 地 使 用 。 这 里 只 需要 BlocksRuntime 
目录 下 的 Block.h、Block_private.h、data.c 以 及 runtime.c 这 4 个 文件 ， 以 
及 根 目 录 下 的 config.h 这 个 文件 即 可 。 此 外 ， 对 于 现在 Visual Studio 2017 
Community 中 的 VS-Clang， 如 果 使 用 _block 对 象 进行 捕获 ， 那 么 代码 生 
成 会 有 问题 ， 一 旦 使 用 _block 对 象 捕获 就 会 引 及 异常 。 所 以 在 Windows 
系统 下 ， 仍 然 建议 各 位 使 用 纯 Clang 编 译 器 做 后 续 对 Blocks 的 实践 。 


代码 清单 18-3 ”Blocks 语 法 的 初步 使 用 





#include <stdio.h> 
int main(int argc, const char * argv[]) 


// 在 main 函 数 中 声明 局 部 对 象 a， 并 将 它 初始 化 为 10 
int a = 10; 














// 声明 一 个 对 void(^) (int ) 类 型 的 Block 的 引用 对 象 ， 并 用 一 个 Block 对 它 初始 化 
void (^refBlock)(int) = 人 ^void(int i) { 
printf("a + i = %d\n", a + i); 











a = 20; 


// 对 Block 引 用 对 象 做 一 次 调用 
refBlock(1); // 输出 : a + i = 11 














a = 30; 











// 对 Block 引 用 对 象 再 做 一 次 调用 
refBlock(1); // 输出 : a + i = 11 











printf("a = %dxn"，a); // 输出 : a = 30 





下 面 我 们 就 来 分 析 代 码 清单 18-3 中 Block。 代 码 清单 18-3 中 ， 我 们 先 
在 main 函 数 中 声明 了 一 个 局 部 对 象 a， 然 后 声明 了 一 个 Block 引 用 对 象 
refBlock， 并 定义 了 一 个 Block 对 该 引用 对 象 进 行 初始 化 。 这 里 ， 我 们 所 
创建 的 Block 的 词法 作用 域 就 是 main 函 数 中 的 语句 块 作用 域 。 然 后 ， 


Block 中 的 对 象 a 就 是 对 main 函 数 中 的 局 部 对 象 a 的 名 字 绑 定 。Block 中 的 a 
古 在 创建 此 Block 时 瓯 已 经 被 创 建 好 了 ， 它 是 将 main 函 数 的 局 部 对 象 a 的 
当前 值 ， 也 就 是 在 创建 该 Block 之 前 那 一 刻 的 值 ， 拷 贝 到 Block 中 的 局 部 
对 象 a 里 的 ， 这 一 过 程 就 是 本 节 一 开始 所 介绍 的 名 字 绑 定 。 





接 下 去 ， 我 们 发 现 无 论 main 函 数 的 局 部 对 象 a 的 值 怎么 修改 ， 在 
Block 中 在 它 创 建 时 所 绑 定 的 a 的 值 不 会 有 任何 改变 。 因 此 我 们 先后 两 次 
调用 了 refBlock 对 象 所 引用 的 Block， 无 论 main 函 数 的 对 象 a 怎 么 修改 ， 
输出 的 结果 都 是 一 样 的 。 





下 面 ， 我 们 用 图 18-1 来 描述 Blocks 语 法 与 相关 计算 机 编程 术语 的 对 
Block 的 引用 对 象 


void (^refBlock)(int) = 


^ void(int i) { 


printf("a + i = %d\n", a + i); 


}; 名 字 绑 定 








图 18-1 ”Blocks 语 法 与 计算 机 编程 术语 的 对 应 


在 图 18-1 中 我 们 可 以 看 到 ，refBlock 对 象 是 对 Block 的 一 个 引用 ， 它 
就 如 同 扮 演 函 数 指针 一 般 的 角色 ， 通 过 refBlock 可 以 直接 调用 由 该 对 象 
所 引用 的 Block。 加 粗 的 矩形 围 住 的 部 分 就 是 一 个 Block， 它 通过 一 个 前 


导 ^ 符 号 引入 ， 后 面 跟着 此 Block 伴 随 实现 的 返回 类 型 以 及 形 参 列表 ， 
与 图 数 体 的 定义 相同 ， 也 是 用 一 对 人 { 来 围 住 对 此 Block 的 实现 。 而 用 加 
粗 的 矩形 所 围 住 的 定义 整个 Block 的 表达 式 就 被 称 为 Lambda 表 达 式 ， 
对 于 Block 而 言 也 是 一 个 财 包 。 





在 Block 的 实现 中 引用 了 该 Block 所 在 函数 的 局 部 对 象 a， 由 于 Block 
有 其 自己 独立 的 执行 环境 ， 所 以 Block 中 的 对 象 a 其 实 与 函数 局 部 对 象 a 
是 两 个 不 同 的 对 象 ， 而 在 这 条 Block 表 达 式 执行 完 之 时 ， 它 所 绑 定 的 a 已 
经 将 其 外 部 函数 局 部 对 象 a 的 值 拷贝 进来 了 。 因 此 ， 在 Block 里 的 a 的 值 
是 不 能 被 修改 的 ， 因 为 它 是 只 读 的 。 同 时 ， 此 后 无 论 外 部 函数 局 部 对 象 
a 的 值 怎么 改变 ， 对 Block 里 的 a 的 值 是 不 会 有 任何 影响 的 。 





至 此 我 们 可 能 会 有 这 么 个 疑问 : 如 果 Block 中 所 绑 定 的 外 部 对 象 的 
值 不 能 修改 ， 那 么 它 跟 真正 的 闭 包 不 是 还 有 一 定 差距 么 ? 而且 实 用 性 也 
大 打折 扣 。 确 实 如 此 ， 现 在 Java 8 对 Lambda 表 达 式 的 实现 也 仅仅 做 到 这 
一 步 而 已 ， 但 Blocks 语 法 则 没 那么 简单 。Blocks 语 法 中 引入 了 
_ block《〈 前 面 带 有 两 条 下 划 线 ) 关键 字 用 来 修饰 可 被 Blocks 以 传 引 用 的 
方式 所 绑 定 的 对 象 。 我 们 查看 代码 清单 18-4 的 示例 。 














代码 清单 18-4 外 部 函数 对 象 以 引用 的 方式 绑 定 给 Block 


ge | 
#include <stdio.h> 
int main(int argc, const char * argv[]) 


// (a Pp 声明 对 象 a 


int a = 10 






































// 在 main 函 数 中 声明 对 象 b， 并 且 对 象 b 将 以 引用 的 方式 绑 定 到 Block 中 
”block int b = 20; 


// 这 里 直接 定义 一 个 Block 而 不 声明 指向 它 的 一 个 引用 对 象 ， 然 后 直接 调用 
A^void(void) 


{ 
a++; // 这 人 句 对 a 的 修改 将 会 报错 


// 下 面 这 句 没 有 问题 因为 外 部 上 局 部 对 象 b 是 以 引用 的 方式 绑 定 到 Block 中 的 对 象 b 的 。 
// 所 以 这 里 的 b += a 操作 其 上 三 步 操作 : 

pa 先 过 81ock 的 b 区 了 所 上 向 的 外 部 局 部 对 象 b 的 好 直 

// 2) 对 外 部 对 象 b 做 b += a 的 操作 
// 3) 将 结果 值 存放 到 外 部 对 象 b 中 
b += a; 











yy 
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} 
// 直接 对 该 Block 进 行 调 | 
(); 


printf("b = %d\n"，b); // 我 们 将 观察 到 ，b 的 值 变 为 了 30 


// 在 定义 一 个 Block 时 ， 如 采 其 返回 类 型 为 void， 那么 void 可 省 ; 

// 如 果 其 参数 列表 为 空 ， 那 么 参数 列表 也 可 省 

void (ArefBJock)(void) = ^ 
printf("Current b = %d\n", b); 



























































b += a; 


printf("After modified, b = %d\n", b); 














/ 我 们 这 里 将 b 的 值 修改 为 25 
b -= 5; 


// 调用 Block， 我 们 发 现在 Block 中 ，b 一 开始 的 值 为 25， 然 后 它 被 修改 成 了 35 
refBlock(); 


// 我 们 再 观察 当前 外 部 函数 局 部 对 象 b 的 值 ， 发 现 b 也 变 成 了 35 
printf("b = %d\n", b); 







































































通过 代码 清单 18-4 我 们 可 以 发 现 ， 用 _block 所 修饰 的 局 部 对 象 b， 
当 把 它 绑 定 到 一 个 Block 中 的 时 候 ， 其 实 相 当 于 是 把 它 的 地 址 传 入 进 
去 ， 而 不 是 它 当 前 的 值 。 而 在 Block 中 访问 b 的 时 候 其 实 也 是 通过 Block 
里 所 绑 定 的 b 的 地 址 去 访问 其 值 的 ， 这 么 一 来 就 可 以 通过 该 地 址 来 修改 
外 部 局 部 对 象 b 的 值 了 。 因 此 说 用 _block 所 修饰 的 局 部 对 象 b 绑 定 到 
Block 的 过 程 其 实 是 传 引 用 的 过 程 ， 而 没有 用 _block 所 修饰 的 局 部 对 象 a 
绑 定 到 Block 的 过 程 其 实 是 传 值 的 过 程 。 图 18-2 给 出 了 Block 绑 定 外 部 局 
部 对 象 的 结构 示意 图 。 





int 8 = 109， a 的 地 址 : 0x0100 


_block int b = 20; b 的 地 址 : 0x0104 


^《{ ”Block 中 a 的 地 址 : 0x1000 


Block 中 b 的 地 址 : 0x1008 


b += a; 
Ox1008 Ox0104 


图 18-2 Block 绑 定 外 部 局 部 对 象 的 结构 示意 图 








从 图 18-2 中 我 们 可 以 看 到 ， 对 于 一 条 b+=a; 这 么 简单 的 语句 ， 在 
Block 中 的 实际 操作 过 程 是 比较 复杂 的 。 这 里 的 复杂 点 是 对 b 的 处 理 一 一 
先 获 得 外 部 局 部 对 象 b 的 地 址 ， 然 后 再 读 取 该 地 址 的 内 容 ， 与 Block 中 的 
a 相 加 之 后 再 写 回 到 外 部 局 部 对 象 b 的 地 址 中 去 。 另 外 ， 在 图 18-2 中 我 们 
可 以 看 到 当 Block 创 建 完 之 后 ，Block 中 a 的 地 址 假设 为 0x1000， 其 存放 
的 数据 就 是 外 部 对 象 a 的 值 ， 而 b 的 地 址 假定 为 0x1008， 而 该 地 址 所 存放 
的 数据 则 是 外 部 对 象 b 的 地 址 ， 而 不 是 此 对 象 b 的 值 。 

















我 们 清楚 了 Block 内 部 的 处 理 机 制 之 后 ， 下 面 我 们 就 要 讨论 如 何 传 
递 Block 引 用 了 。 因 为 Block 是 一 个 代码 块 ， 它 的 实现 可 以 非常 灵活 ， 比 
如 可 以 与 它 所 在 的 函数 共享 同一 代码 空间 ， 也 可 以 把 Block 中 的 代码 存 
放 到 其 他 代码 存储 段 中 。 但 是 其 执行 上 下 文 〈 也 就 是 执行 环境 ) 必须 得 
到 安全 维护 ! 我 们 知道 ， 一 旦 退出 了 一 个 函数 体 ， 那 么 该 函数 中 的 所 有 
局 部 对 象 都 会 被 自动 销毁 ， 而 Block 的 执行 上 下 文 其 实在 存储 类 型 上 来 
说 也 是 auto 类 型 的 ， 它 与 当前 所 在 的 函数 共享 同一 个 栈 空间 ， 跟 该 函数 
中 的 局 部 对 象 一 样 。 这 么 做 有 两 大 好 处 ， 首 先 在 我 们 不 想 把 函数 中 所 定 
义 的 Block 传 到 外 部 的 时 候 ， 在 函数 内 对 Block 的 实现 可 以 做 很 大 优化 ， 
比如 在 Clang 的 实现 中 是 把 外 部 函数 中 用 block 所 声明 的 对 象 与 Block 中 
跟 它 绑 定 的 对 象 作为 同一 个 实体 ， 也 就 是 说 两 者 共享 同一 栈 存储 单元 ; 
其 次 ， 如 果 在 每 次 调用 函数 的 时 候 都 要 创建 一 次 其 内 部 的 Block 执 行 上 
下 文 ， 那 么 什么 时 候 释 放 该 Block 的 执行 上 下 文 呢 ? 这 是 个 问题 。 因 此 
Blocks 语 法 中 引入 了 运行 时 库 <Block.h>， 这 个 库 中 有 两 个 宏 函 数 接口 
Block_copy 与 Block_release。Block_copy 接 口 是 先 动态 分 配 一 块 存 
储 空间 ， 然 后 将 所 指定 的 Block 的 执行 上 下 文 拷贝 到 分 配 的 存储 空间 
中 。Block_release 则 是 释放 所 指定 的 Block 执 行 上 下 文 。 当 我 们 要 把 在 某 
个 函数 中 定义 的 Block 传 递 到 其 他 模块 执行 前 ， 可 以 通过 Block_copy 接 
口 将 指定 的 Block 上 下 文 动态 分 配给 该 Block 引 用 的 持 有 者 ， 然 后 由 该 持 
有 者 自己 管理 何 时 通过 Block_release 进 行 释 放 。 代 码 清单 18-5 将 展示 这 
对 接口 的 用 法 。 














代码 清单 18-5。 Block 执行 环境 的 保存 与 释放 


#include <stdio.h> 


struct MyObject 















































吉 构 体 对 象 并 返回 将 其 首 地 址 返回 */ 




















_Nullable refBlock) (int)) 

















// 如 果 refBlock 不 空 ， 则 拷贝 其 执行 上 下 文 ， 并 将 拷贝 之 后 的 引用 赋值 给 block 成 员 





{ 
int a; 
void (^block)(int); 
/** 通过 动态 分 配 存储 空间 的 方式 创建 一 个 My0bject 
struct MyObject *CreateMyObject(void(^ 
{ 
struct MyObject *pobj = malloc(sizeof(*p0Obj)); 
pobj->a = 1; 
if(refBlock != NULL) 
pObj->block = Block_copy(refBlock); 
else 
pObj->block = NULL; 
return pObj; 
} 
/** 销毁 指定 的 My0bject 结 构 体 对 象 */ 


void DestroyMyObject(struct MyObject* 


} 


// 如 果 p0bj 所 指向 的 对 象 不 空 ， 则 将 它 释 放 
if(pObj != NULL) 
{ 





// 先 释 放 p0bj 的 block 成 员 
if(pObj->block != NULL) 
Block_release(p0bj->block); 


free(pobj ) ， 


static struct MyObject* Test(void) 


int a = 10; 
_ block int b = 20; 


_Nullable pobj ) 


printf("address of a: %.16tX\n", (uintptr_t)e&a); 
printf("address of a: %.16tX\n", (uintptr_t)e&b); 


void (^block)(int) = 人 ^(int i){ 


printf("In block, address of a: 
printf("In block, address of a: 


b += a + i,; 


%.16txX\n", (uintptr_t)e&a); 
%.16txX\n", (uintptr_t)e&b); 


printf("a = %d, b = %d\n", a, b); 


}; 


// 这 里 先 调用 一 次 Block 
block(100); 





















































// 创建 CreateMy0bject 对 象 ， 将 block 引 





作为 人 








参 传递 进去 


struct MyObject *pobj = CreateMyObject(block); 


return po0bj 

















/** Func 函 数 将 返回 一 个 类 型 为 int(^) (int ) 的 Block 引 用 对 象 */ 
int (^Func(int a))(int) 








































































































































































































































































































































































































































































































{ 
”block int c =a + 1; 
// 声明 一 个 Block 的 引用 对 象 bDlock， 并 将 它 指 向 一 个 int(^) (int ) 类 型 的 Block 实 现 
int (Ablock)(int) = Aint(int 工 ) { 
C- 十 = 了 工 ; 
return c; 
// 各 位 必须 注意 的 是 ， 如 果 一 个 函数 要 把 它 内 部 的 一 人 
// 则 必须 使 用 Block_copy， 和 否则 在 外 部 再 调用 Block_copy 则 已 经 晚 了 
// 运行 时 可 能 会 发 生 异 常 
return Block_copy(block); 
} 
int main(int argc, const char * argv[]) 
{ 
Struct MyObject *pobj = Test(); 
// 在 main 函 数 中 调用 了 block 引 用 之 后 ， 我 们 发 现 此 BlLock 中 的 a 和 b 的 值 都 被 完整 地 保留 
// 此 外 ，Block 中 a 和 b 的 地 址 都 被 改变 了 ， 
// 因为 它 所 在 的 执行 上 下 文 从 Test 函 数 的 栈 空间 被 移入 了 动态 分 配 的 存储 空间 
pObj->block(pObj->a); 
// 我 们 再 次 调用 Test 函 数 ， 我 们 发 现 第 二 次 进入 Test 后 ， 
// 其 中 Block 的 上 下 文 会 按照 当前 函数 调用 的 执行 环境 再 做 安排 ， 
// 然后 再 通过 动态 分 配 的 存储 空间 ， 拷 贝 到 p0bj2 的 block 成 员 中 
Struct MyObject *pobj2 = Test(); 
// 我 们 可 以 再 调用 一 次 再 观察 情况 ，Block 中 b 的 值 仍然 安全 地 维护 
pObj->block(pObj2->a); 
// 我 们 再 调用 p0bj2 的 block 
pObj2->block(5); 
DestroyMyobject(pobj ) ， 
DestroyMyobject(pobj2) 
// 调用 Func 函 数 
int (^refBlock)(int) = Func(10); 
// 通过 Func 函 数 所 返回 的 Block 引 用 调用 该 Block 
int value = refBlock(3); 
printf("value = %d\n"，value); // 这 里 输出 : value = 14 
// 我 们 可 以 再 调用 一 次 
Value = refBlock(2); 
printf("value = %dxn"，Vvalue); // 这 里 输出 : value = 16 
// 由 于 这 里 的 refBlock 是 通过 Func 函 数 最 后 的 Block_copy 得 到 的 ， 
// 所 以 用 完 之 后 ， 我 们 要 使 用 Block_release 将 它 释放 
Block_release(refBlock); 
} 





代码 清单 18-5 提 供 了 很 多 信息 。 首 先 ， 我 们 可 以 看 到 在 做 


Block_copy 之 前 Block 里 与 外 部 函数 绑 定 的 对 象 的 地 址 ， 然 后 在 
Block_copy 操 作 之 后 这 些 对 象 地 址 的 变化 。 然 后 ， 我 们 还 能 看 到 如 何 使 
用 Block_copy 与 Block_release 做 Block 引 用 的 拷贝 与 释放 ， 并 且 在 
Block_copy 操 作 之 后 ， 原 先 函数 中 Block 内 部 绑 定 对 象 的 值 都 完好 地 保 
存 着 。Block 执 行 环境 在 内 部 会 有 引用 转移 机 制 ， 也 就 是 说 ， 当 Block 所 
在 的 函数 即将 返回 时 ， 它 会 将 所 绑 定 的 _block 对 象 解除 引用 ， 使 得 该 
Block 内 的 名 字 绑 定 对 象 指 向 自己 执行 环境 中 的 某 个 存储 空间 ， 并 将 那 
时 刻 的 _block 对 象 的 值 拷贝 到 那个 存储 空间 中 。 这 样 ， 等 函数 返 
后 ， 无 论 怎么 调用 此 Block， 访 问 用 _block 所 修饰 的 名 字 绑 定 对 象 都 访 
问 同一 个 执行 环境 中 的 存储 空间 ， 而 不 会 再 受 函 数 栈 空间 的 影响 。 








最 后 ， 我 们 还 获悉 如 果 一 个 图 数 要 返回 它 里 面 所 定义 的 一 个 Block 
对 象 引 用 ， 那 么 将 该 Block 引 用 返回 之 前 必须 通过 Block_copy 操 作 。 如 
果 不 在 此 函数 里 使 用 Block_copy 操 作 ， 而 是 在 外 部 该 函数 调用 结束 之 后 
再 使 用 Block_copy 操 作 ， 那 么 执行 可 能 就 会 引发 异常 。 此 外 ， 即 便 在 函 
数 返 回 之 后 立即 调用 Block_copy 操 作 也 不 行 ， 因 为 Block 的 执行 上 下 文 
在 做 Block_copy 操 作 之 前 都 是 与 该 函数 的 栈 空间 所 共享 的 ， 一 旦 函数 返 
回 ， 则 栈 内 会 发 生 一 定 变 化 从 而 可 能 直接 或 间接 地 对 Block 的 执行 环境 
造成 破坏 。 














Block 除 了 可 以 定义 在 函数 内 之 外 还 能 定义 在 文件 作用 域 。 当 然 ， 
如 宁 一 个 Block 实 现 定 义 在 文件 作用 域 ， 那 么 它 其 实 就 跟 普 通 函 数 关 不 











多 了 ， 因 为 它 也 不 需要 绑 定 任何 局 部 对 象 ， 它 的 栈 空 间 本 身 就 是 独立 
的 。 我 们 还 可 以 在 其 他 语句 块 内 定义 一 个 Block， 但 需要 注意 的 是 ，C 语 
言 标准 已 经 明确 指出 ， 当 一 个 语句 块 中 的 局 部 对 象 出 了 这 个 语句 块 作用 
域 ， 那 么 它 的 生命 周期 也 就 到 头 了 ， 即 便 在 有 的 时 候 通 过 指针 来 间接 访 
问 这 些 对 象 可 能 会 好 使 。 不 过 我 们 还 是 要 注意 ， 在 语句 块 中 定义 的 
Block 如 果 要 出 了 该 语句 块 之 后 对 它 调用 的 话 还 是 应 当先 调用 
Block_copy。 最 后 提醒 大 家 的 是 ， 在 Block 中 不 能 绑 定 一 个 数组 对 象 。 
如 果 我 们 要 把 一 个 数组 对 象 传递 到 一 个 Block 中 可 以 通过 参数 传递 的 方 
式 ， 或 是 通过 用 一 个 结构 体 来 封装 。 代 码 清单 18-6 展 示 了 以 上 这 些 
Block 使 用 上 的 特性 














代码 清单 18-6 ”Blocks 语 法 的 其 他 使 用 细节 





#include <stdio.h> 
#include <Block.h> 
#include <string.h> 


static int S_array[] = {1, 2, 3 }; 























// 这 里 声明 了 一 个 返回 类 型 为 jnt(*)[3]， 无 参数 列表 的 Block 引 用 对 象 nyBlock， 
// 并 且 直 接 在 文件 作用 域 实现 了 该 Block 
static int (*(^myBlock)(void))[3] = ^int(*(void))[3] { 
return &s_array; 
}; 


int main(int argc, const char * argv[]) 


// 对 于 类 型 比较 复杂 的 Block 引 用 ,我们 可 以 直接 用 _auto_type， 非 常 简便 
auto_type block = myBlock; 















































































































































// 我 们 通过 main 函 数 中 声明 的 Block 引 用 对 象 block 来 调用 此 block 
int (*pArr)[3] = block(); 





// 声明 array 数 组 对 象 
int array[] = { pArr[9][9]，pArr[9][1]，pArr[9][2] }; 


// 在 Block 中 无 法 直接 绑 定 外 部 函数 的 局 部 数组 对 象 ， 因 此 这 里 直接 通过 结构 体 来 封装 


struct { int arr[3]; } s; 


// 将 数组 array 的 数据 拷贝 到 s 对 象 中 


memcpy(&s, array, sizeof(array)); 

































































void (^block2)(void) = NULL 
if(array[0] > 0) 


block2 = 人 ^{ 
int sum = 0; 
for(int i = 0; i < sizeof(s.arr) / sizeof(s.arr[0]); 
i++) 
sum += s.arr[i]; 


printf("The sum is: %d\n", sum); 


// 当然 ， 我 们 可 以 在 Block 中 直接 访问 指向 数组 的 指针 对 象 
sum = 0; 
for(int i = 0; i < 3; i++) 
sum += (*pArr)[i]， 
printf("The second sum is: %d\n", sum); 










































































}; 

// 我 们 在 这 里 通过 block2 调 用 if 语 句 块 中 定义 的 Block 没 有 问题 

block2( ); 

// 但 是 一 旦 我 们 需要 在 if 语 句 块 作用 域外 调用 block2， 则 必须 用 Block_copy 















































block2 = Block_copy(block2); 
} 


if(block2 != NULL) 
block2( ); 


// 用 完 之 后 释放 
Block_release(block2); 




















在 了 解 了 Blocks 语 法 之 后 ， 下 面 将 给 大 家 呈现 如 何 通 过 Grand 
Central Dispatch 利 用 多 核 多 线程 来 对 一 个 数组 做 求 和 计算 。 先 看 代码 清 
单 18-7。 


代码 清单 18-7 通过 Grand Central Dispatch 做 多 核 多 线程 并 行 求 和 
计算 





#include <stdio.h> 

#include <stdbool.h> 

#include <stdatomic.h> 
#include <dispatch/dispatch.h> 


static int s_buffer[5][10000]; 


int main(int argc, const char * argv[]) 











// 对 s_buffer 进 行 初始 化 
for(int i = 0; i < 5; i++) 





for(int j = 0; j < 10000; j++) 
s_buffer[i][j] = 10000 * i + j; 
} 


// 声明 用 于 做 并 行 计算 的 行 索引 


_ block volatile atomic_int rowIndex 


// 声明 用 于 最 后 计算 的 结果 
_ block volatile atomic_int result; 


// 通用 标识 用 户 线程 的 计算 全 部 完成 
”block volatile bool IsCompJleted = false; 
















































































// 先 对 行 索引 初始 化 为 6 
atomic_ init(&rowIndex, 0); 


// 对 计算 结果 初始 化 为 0 


atomic_init(&result, 0); 





// 定义 计算 Block 
void (^computeBlock)(void) = 人 ^{ 
// 确定 当前 要 计算 的 行 


int row; 


while(row = atomic fetch add(&rowIndex, 1), row < 5) 


{ 
int Sum = 0) 
for(int i = 0; i < 10000; i++) 
sum += S_buffer[row][I]， 


// 将 当前 计算 结果 与 result 值 相 加 


atomic_ fetch add(&result, sum); 

















} 
}; 


// 线程 分 派 执行 计算 Block 
dispatch_async(dispatch_get_global_queue(Q0S_CLASS_USER_INTERACTIVE， 
9) 
^{ computeBlock( ); iscompleted = true; }); 


// 在 主线 程 上 执行 计算 Block 
computeBlock( ); 


// 如 果 用 户 线程 没有 执行 完成 ， 则 一 直 等 待 
while( !isCompleted) 
asm("pause"); 





























printf("The result is: %d\n", atomic load(&result)); 






































// 我 们 下 面 用 单线 程 传统 算法 计算 ， 校 验 结果 
int sum = 0; 
for(int i = 0; i < 5; i++) 


for(int j = 0; j < 10000; j++) 
sum += s_buffer[i][j]; 


} 


printf("sum = %d\n", sum); 











如 条 我 们 在 Linux 下 编译 运行 代码 清单 18-7 的 话 ， 则 需要 连接 
libdispatch 库 ， 可 以 用 -ldispatch 命 令 选项 。 


下 面 我 们 来 分 析 一 下 代码 清单 18-7。 首 先 ， 我 们 在 文件 作用 域 声 明 
了 一 个 s_buffer 数 组 对 象 ， 它 可 以 看 作 具 有 5 行 10000 列 int 类 型 元 素 的 二 
维 数 组 。 我 们 要 做 的 事情 就 是 利用 双核 双 线 程 对 这 个 数组 中 所 有 元 素 进 
行 求 和 。 这 里 所 采用 的 方法 其 实 也 比较 简单 ， 每 个 线程 都 做 同样 的 操 
作 ， 即 先 获取 当前 它 要 操作 的 某 一 行 元 素 的 索引 ， 然 后 对 该 行 元 素 做 求 
和 计算 ， 最 后 把 得 到 的 求 和 结果 与 总 的 结果 进行 相 加 。 











main 函 数 中 ， 一 开始 先 对 s_buffer 数 组 所 有 元 素 进行 初始 化 。 然 后 
声明 用 于 并 行 计算 的 当前 行 索引 以 及 结果 ， 这 两 个 必须 是 原子 对 象 ， 
为 它们 是 两 个 线程 所 共 孚 的 对 象 ， 并 且 都 会 在 这 些 线程 中 进行 修改 。 
isCompleted 对 象 仅 仅 在 用 户 线程 中 进行 号 ， 而 在 主线 程 中 进行 读 ， 因 此 
这 里 不 需要 使 用 原子 对 象 。 





在 Block 中 的 计算 过 程 也 不 复 杀 ， 人 驳 用 原子 加 法 对 rowIndex 对 象 做 
加 1 操作 ， 由 于 它 返 回 的 正好 是 修改 之 前 的 值 ， 所 以 处 理 起 来 很 方便 ， 
直接 用 当前 得 到 的 行 索引 值 进 行 判 定 ， 如 果 小 于 5 则 做 求 和 计算 ， 人 否则 
退出 循环 。 对 于 当前 行 数组 每 个 元 系 的 求 和 不 要 使 用 原子 操作 ， 因 为 原 
子 操作 非常 缓慢 ， 会 使 得 多 核 多 线程 性 能 还 远 不 如 单线 程 的 性 能 ， 所 以 
我 们 仅仅 把 当前 行 元 素 获得 的 求 和 结果 与 总 和 结果 做 一 次 原子 加 法 操作 
印 可 。 





dispatch_async 函 数 就 是 Grand Central Dispatch 中 用 于 异步 创建 用 户 
线程 并 分 派 执行 的 接口 。 第 一 个 参数 是 指定 当前 用 户 线程 的 优先 级 ， 其 
中 QOS_CLASS_USER_INTERACTIVE 是 最 高 优先 级 ， 








QOS_CLASS_BACKGROUND 是 最 低 优先 级 。 第 二 个 参数 总 是 传 0， 现 
在 还 没有 任何 作用 ， 留 在 以 后 作为 扩展 使 用 。 第 三 个 参数 则 是 

void (^) (void) 类 型 的 Block 引 用 。 我 们 在 这 里 又 创建 了 一 个 新 的 
Block， 因 为 对 于 用 户 线程 ， 我 们 需要 它 告 知 主线 程 当 前 计算 任务 是 否 
已 经 执行 完成 ， 我 们 在 这 里 也 能 看 到 ， 一 个 Block 中 也 可 以 舱 套 调用 其 
他 Block。 下 面 就 是 在 主线 程 上 直接 调用 computeBlock 进 行 计算 ， 然 后 
等 待 用 户 线程 计算 结束 后 获取 最 终结 果 。asm (“pause”) ; 是 使 用 x86 
处 理 器 的 PAUSE 指 令 ， 用 来 指示 处 理 器 当前 线程 正 处 于 循环 等 待 ， 可 以 
使 用 超 线程 等 硬件 线程 技术 切换 给 其 他 线程 执行 。 如 果 各 位 将 上 述 代码 
运行 在 ARMv7 或 ARMv8 架 构 的 处 理 器 上 ， 那 么 可 以 使 用 

asm ("yield") ; ， 效 果 一 样 。 








18.5 本章 小 结 


本 章 介绍 了 Clang 编 译 器 在 GCC 所 支持 的 GNU 语 法 扩展 上 自己 又 新 
增 的 一 些 语法 特性 。 本 章 着 重 介 绍 了 Blocks 语 法 的 使 用 ， 大 家 如 果 能 掌 
握 好 这 个 语法 那 必 有 用 武之 地 ， 因 为 OpenCL 2.0 也 已 经 引入 了 Blocks 语 
法 特性 作为 其 Lambda 表 达 式 ， 可 用 于 管道 异步 操作 。 而 对 于 iOS、 
macOS 的 开发 者 来 说 学 会 Blocks 语 法 就 显得 更 为 重要 了 ， 因 为 Apple 
Cooca Framework 现 在 很 多 接口 都 含有 Blocks， 很 多 消息 接口 都 是 以 
Block 引 用 的 方式 作为 回调 参数 的 。 











至 此 ， 本 书 的 内 容 就 接近 尾声 了 。 下 面 将 畅想 一 下 C 语 言 标准 的 现 
在 与 未 来 ， 希 望 能 从 中 给 广大 C 语 言 编程 爱好 者 对 C 语 言 的 设计 以 及 理 
念 市 来 更 多 局 迪 。 


第 19 章 ”对 C 语 言 的 未 来 展望 


我 们 到 目前 为 止 已 经 把 所 有 C11 编 程 语言 所 包含 的 语法 特性 都 讲述 
完了 。 本 章 我 们 将 主要 根据 当前 C 语 言 标准 委员 会 的 WG14 工 作 小 组 对 
下 一 个 C 语 言 标准 一 一 目前 内 部 定 为 C2X 已 经 做 的 工作 成 果 来 展望 一 下 
未 来 。 





首先 ，C 语 言 标准 委员 会 已 经 非常 明确 了 ，C 语 言 在 未 来 不 会 增加 

面向 对 象 的 特性 。 因 为 当前 基于 C 语 言 的 带 有 面向 特性 的 编程 语言 已 经 
很 多 了 ， 典 型 的 有 大 部 分 兼容 C 语 言语 法 的 C++ 编程 语言 ， 基 于 C 语 言 编 
译 嚣 本身， 然后 仅 提 供 一 个 预 编译 器 的 Objective-C。Objective-C 与 C 语 
言 完全 兼容 ， 甚 至 共用 同一 个 C 编 译 器 。 它 先 将 一 些 Objective-C 中 的 语 
法 标签 翻译 为 相应 的 C 函 数 调用 ， 然 后 通过 C 语 言 编译 器 进行 编译 ， 然 

后 与 自身 的 运行 时 库 进 行 连接 生成 最 终 的 可 执行 程序 。 因 此 目前 编程 语 
言 的 市 场 反 而 是 基于 面向 对 象 的 编程 语言 比 仅 面向 过 程 的 要 多 ， 而 C 语 
言 独善其身 ， 不 受 面向 对 象 语 法 特性 的 影响 : 一 方面 能 维持 其 纯粹 性 ， 

使 得 它 能 适用 于 更 广泛 的 运行 生产 环境 ， 因 而 也 能 长 期 成 为 工业 标准 化 
的 编程 语言 ， 另 一 方面 ， 这 也 能 保持 C 语 言 可 预见 的 内 存 模 型 ， 我 们 可 
以 很 容易 地 判断 一 个 结构 体 中 成 员 如 何 编排 、 占 用 多 少 存储 空间 等 ， 这 
在 其 他 面向 对 象 的 编程 语言 中 是 很 难 ， 甚 至 是 无 法 做 到 的 。 而 且 这 也 使 
得 C 语 言 能 更 好 地 与 汇编 语言 相 结合 ， 解 决 偏向 底层 硬件 系统 的 问题 。 









































其 次 ，C 语 言 在 语法 体系 上 的 进化 步伐 不 会 迈 得 太 大 。C 语 言 标准 
委员 会 也 在 尽量 控制 C 语 言语 法 体系 的 膨胀 度 。 如 果 一 门 编程 语言 太 过 
膨胀 则 会 导致 编译 器 项 目 将 难以 维护 ， 并 且 会 引发 各 种 Bug， 其 实 这 一 
点 在 C++ 编程 语言 上 体现 得 十 分 明显 。 现 在 主流 编译 器 都 能 支持 到 
C++14 标 准 ， 但 关于 这 些 C++ 编译 器 的 Bug 报 告 也 在 源源 不 断 地 产生 。 
C++17 标 准 还 会 添加 不 少 东 西 ， 对 于 C++ 编程 语言 而 言 ， 它 已 经 变 得 过 
于 腾 肿 。 在 这 一 点 上 ，C 语 言 发 展 的 谨慎 还 是 非常 难得 的 ， 这 个 时 代 做 
减法 反而 更 难能可贵 ， 这 也 是 为 什么 笔者 对 C 语 言 如 此 情 有 独 钟 的 原因 
之 一 。 不 过 C2X 标 准 也 会 将 一 些 比较 好 的 现 有 C++ 特性 引入 进来 ， 后 续 
小 节 中 会 有 所 介绍 ， 但 不 会 导致 语法 特性 过 于 庞杂 。 下 一 个 C 语 言 标准 
目前 内 部 称 为 C2X， 说 明 它 将 在 2020 一 2029 年 之 间 的 某 个 时 候 发 布 ， 不 
过 笔者 估计 在 2020 一 2022 年 之 间 发 布 的 可 能 性 高 。 




















最 后 ， 笔 者 先 大 概 描 述 一 下 目 己 希望 未 来 C 语 言 能 提供 的 一 些 语法 
特性 ， 然 后 在 以 下 各 节 介 绍 现在 WG14 工 作 小 组 基本 已 经 确定 要 在 C2X 
中 引入 的 语法 特性 。 笔 者 希望 C2X 标 准 能 引入 以 下 这 些 语法 特性 。 


1) 支持 半 精 度 浮 点 数 : 随 着 3D 图 形 演 染 以 及 图 像 处 理 的 多 媒体 应 
用 需求 增多 ， 不 少 处 理 器 开发 商都 已 经 在 自己 的 处 理 器 中 引入 了 16 位 半 
精度 浮 点 数 的 计算 处 理 单元 。 而 在 2008 年 ，IEEE754 标 准 也 在 8 月 发 布 了 
最 新 浮 点 数 格式 表达 标准 ， 此 后 支持 半 精 度 浮 点 数 存储 格式 的 处 理 器 的 
种 类 就 更 多 了 。 这 十 分 常见 于 GPU 中 ， 而 当前 基于 Haswell 微 架构 的 Intel 








处 理 器 以 及 基于 支持 VFPv4 ARMV7 架 构 以 及 ARMv8 架 构 的 ARM 处 理 器 
都 支持 半 精 度 浮 点 数 的 存储 。 当 前 GCC 和 Clang 编 译 器 已 经 通过 GNU 语 
法 扩展 引入 了 半 精 度 浮 点 数 类 型 ，fp16， 尽 管 现在 大 部 分 CPU 不 能 直接 
对 半 精 度 浮 点 数 做 加 减 乘除 算术 运算 ， 但 是 能 够 在 单 精 度 浮 点 类 型 与 半 
精度 浮 点 类 型 之 间 相 互 转换 。 再 过 几 年 之 后 ， 随 着 处 理 器 支持 半 精 度 浮 
点 的 处 理 能 力 增强 ，C 语 言 标准 也 应 该 增加 对 半 精 度 浮 点 数 的 支持 ! 根 
据 当前 C 语 言 标准 新 增 关 键 字 的 命名 特性 ， 使 用 _Half 作 为 半 精 度 浮 点 数 
的 类 型 标识 符 比较 合适 。 然 后 在 标准 库 中 引入 <half.h>， 可 以 将 _Half 宏 
定义 为 half。 

















2) 将 GNU 语 法 扩展 中 的 typeof 纳 入 标准 : 萃取 一 个 数据 对 象 的 类 
型 在 很 多 方面 都 会 显得 十 分 方便 ， 而 且 C++11 中 也 引入 了 dedltype 关 键 
字 ， 其 作用 与 typeof 十 分 类 似 ， 而 且 还 能 作为 函数 类 型 推导 使 用 。 因 此 
C 语 言 标准 在 引入 typeof 上 也 不 会 显得 十 分 困难 ， 毕 竟 GCC 和 Clang 对 此 
关键 字 已 经 用 了 十 多 年 了 。 











3) 类 型 自动 推导 : 很 多 现代 化 编程 语言 都 有 类 型 自动 推导 特性 ， 
比如 2014 年 新 生 的 Swift 编程 语言 ， 还 有 C++11。 类 型 自动 推导 在 一 定 程 
度 上 能 省 去 不 少 代码 以 及 一 些 不 必要 的 类 型 转换 ， 配 合 typeof 使 用 将 威 
力 无 穷 。 如 果 运 用 在 宏 定 义 中 的 话 ， 能 体现 出 无 与 伦比 的 灵活 性 和 强大 
性 能 。 而 这 个 语法 特性 也 在 GCC 4.9 以 及 Clang 3.8 中 通过 引入 
_auto_type 关 键 字 实现 了 。 


4) 引入 Lambda 表 达 式 : Lambda 表 达 式 在 并 行 计 算 上 能 发 挥 很 大 优 
势 ， 这 一 点 在 Apple 开 源 的 Grand Central Dispatch 中 就 已 经 体现 得 淋漓 尽 
致 。Apple 将 Blocks 语 法 引入 到 Clang 编 译 器 中 ， 它 工作 恨 好 ， 不 仅 能 
起 到 简化 代码 的 作用 ， 而 且 还 能 提升 并 行 计算 的 性 能 。 因 此 笔者 这 里 希 
望 C2X 中 能 引入 Blocks 语 法 或 者 类 似 的 Lambda 表 达 式 。 


下 面 我 们 将 所 选 几 条 比较 有 意思 的 WG14 工 作 小 组 基本 已 经 确定 要 
在 C2X 中 引入 的 语法 特性 。 


19.1 Ci 语言 中 的 属性 





当前 C 语 言 标 准 中 是 没有 “属性 ”这 个 语法 特性 的 。 其 中 ， 我 们 常用 
的 像 字 节 对 齐 这 类 属性 已 经 转 为 相应 的 关键 字 _Alignof 与 _Alignas 作 为 
类 型 限定 符 使 用 。 而 如 果 要 描述 一 个 对 象 、 函 数 或 类 型 的 其 他 属性 只 能 
借助 编译 器 各 自 的 实现 定义 。 比 如 在 MSVC 中 使 用 的 是 _ declspec 关 键 
字 来 引出 一 个 属性 ;在 GCC 与 Clang 编 译 器 中 则 使 用 _attribute ”关键 字 
来 引出 一 个 属性 。 








C++11 标 准 已 经 通过 [[< 属 性 表达 式 >]] 这 一 语法 特性 来 描述 一 
数 、 对 象 或 类 型 的 属性 。 而 这 次 C 语 言 标准 委员 会 也 想 借助 这 种 表示 法 
来 描述 属性 。 这 样 ， 以 后 我 们 要 使 用 属性 时 就 不 需要 根据 不 同 编译 器 来 
使 用 _declspec 或 ，、 attribute 了 ， 而 直接 使 用 [[]] 即 可 。 











代码 清单 19-1 将 展示 [[]] 属 性 表达 式 的 使 用 方式 以 及 效果 。 


代码 清单 19-1 C2X 的 属性 





#include <stdio. 
// 定义 一 个 总 是 和 被 闹 尝 器 内 联 的 函数 


static int [[ always_inline ]] foo(int a, int b) 


return a + b; 


int main(int argc, const char * argv[]) 


// 声明 一 个 整数 对 象 a， a 
int [[ mode(byte) ]] a = 0; 

// 定义 一 不 吕 8 学 节 半 并 欧 结 杨 体 

Struct MyStruct { 


Short a, b; 
} [[ aligned(8) 1]]; 





代码 清单 19-1 中 可 以 看 到 ， 使 用 [[]] 属 性 的 方式 与 _attribute_ 很 类 
似 ， 而 且 摆 放 位置 也 差不多 一 样 ， 但 在 表达 上 则 更 为 简洁 。 


19.2 _ fallthrough 属 性 


我 们 平时 在 写 switch-case 语 句 的 时 候 ， 一 般 情况 下 每 条 case 语 句 结 
尾 处 都 会 使 用 一 个 break 或 是 return 来 跳出 该 选择 分 文 。 但 是 在 有 些 时 
候 ， 我 们 确实 想 在 处 理 完 当前 case 分 文 之 后 再 直通 〈fallthrough) 到 下 一 
条 case 语 句 紧 接着 处 理 。 因 此 原 有 的 C 语 言 就 有 默许 case 语 句 直 通 的 功 
能 。 但 是 程序 员 不 是 神仙 ， 如 果 当 我 们 在 编号 程序 中 不 是 有 意 要 让 当前 
case 语 句 直 通 ， 而 是 漏 加 了 一 条 break 语 句 ， 那 么 程序 就 可 能 会 发 生意 想 
不 到 的 情况 。 而 且 在 这 种 情况 下 ， 由 于 编译 器 也 缺乏 足够 的 条 件 来 判定 
程序 员 是 漏 加 了 break 语 句 还 是 故意 想 让 case 语 句 直 通 ， 所 以 也 不 会 给 出 
任何 提示 。 因 此 C++17 标 准 引 入 了 [[fallthrough]] 属 性 显 式 地 提示 当前 
case 语 句 需 要 直通 到 下 一 条 case， 这 样 一 来 编译 器 能 够 判断 出 当前 程序 
员 是 否 漏 加 了 break 还 是 有 意 让 case 语 名 直通 。 而 这 个 属性 也 将 在 C2X 标 
准 中 被 采纳 。 






































[[fallthrough]] 这 个 属性 与 其 他 属性 有 些 不 同 ， 它 不 作为 对 象 、 函 
数 、 类 型 的 限定 符 的 样式 进行 使 用 ， 而 是 类 似 于 一 条 语句 ， 就 像 break 
语句 那样 。 标 准 中 也 提 到 了 ，[[fallthrough]] 只 能 用 在 case 语 句 中 ， 并 且 
只 能 放 在 下 一 条 case 语 句 的 上 面 。 倘 若 两 条 case 语 句 之 间 没 有 任何 语 
人 句 ， 那 么 可 以 不 用 [[fallthrough]]; 不 然 必须 用 [[fallthrough]] 显 式 指明 当 
前 case 语 句 直 通 到 下 一 条 case 语 句 ， 不 然 编译 器 应 该 报 出 警告 。 代 码 清 





单 19-2 将 摘 述 的 [[fallthrough]] 属 性 的 大 致 用 法 。 


代码 清单 19-2 [[fallthrough]] 属 性 的 大 致 用 法 





#include <stdio.h> 
int main(void) 
int n = 1; 


switch (n) 










































































Case 0: 
// 由 于 case 0 与 case 1 之 间 没 有 任何 表达 式 ， 所 以 这 里 不 需要 使 用 [[fallthrough]] 
case 1: 
























































++n; 
[[fallthrough]]; // 这 里 通过 [[fallthrough]] 进 行 直 通 











n 大 一 2 
// 由 于 case 2 下 面 含有 一 条 case 标 签 语句 ， 但 没有 出 开 m[[fallthrough]], 
// 而 采用 的 是 隐 式 直通 ， 所 以 编译 器 这 里 应 该 给 出 警告 

















































































































// 这 里 通过 执行 break 语 句 而 跳出 了 此 Switch 选择 语句 块 ， 
// 所 以 前 面 的 [[fallthrough]] 都 只 能 直 通 到 这 里 





































































































break; 
defauilt: 
n = 0; // 这 里 的 default 分 支 不 会 被 执行 ， 因 为 通过 直通 执行 到 case 3 条 件 







































































// 这 里 使 用 [[fallthrough]] 编 译 器 会 发 出 警告 ， 因 为 后 续 没 有 case 标 签 了 。 
[[fallthrough]]; 






































// 这 里 输出 : n = 3 
printf("n = %d\n", n); 








代码 清单 19-2 中 列 出 了 [[fallthrough]] 属 性 的 基本 使 用 方式 以 及 一 些 
约束 限制 。 这 里 ，n 的 值 满足 case 1， 然 后 做 完 ++n 操 作 之 后 通 
[[fallthrough]] 直 通 到 case 2 继续 做 n*=2 操 作 。case 2 条 件 分 支 的 最 后 使 用 
了 当前 C 语 言 的 默认 直通 方式 ， 这 会 引发 C2X 编 译 器 的 警告 ， 不 过 这 也 

能 成 功 地 直通 到 case 3 语句 的 处 理 。case 3 分 支 通过 break 语 句 跳出 当前 
switch 语 句 块 。 因 此 n 对 象 经 过 了 上 述 除了 default 之 外 的 所 有 case 语 句 的 


处 理 执行 ， 结 果 为 3。 


19.3 ”数组 片段 


数组 片段 这 个 语法 特性 的 灵感 来 源 于 比 C 语 言 更 古老 的 Fortran 编 程 
语言 。C2X 标 准 增加 数组 片段 特性 其 实 不 仅仅 是 为 了 加 入 一 些 语法 糖 ， 
使 得 数组 操作 更 为 灵活 、 方 便 ， 而 主要 是 为 了 激发 当前 现代 化 果 面 处 理 
器 以 及 智能 移动 处 理 器 的 多 线程 与 IMD ( 单 指令 多 数据 〉 指 令 集 的 威 
Hs 





数组 片段 的 语法 其 实 非常 简单 : 








< 数组 对 象 标 识 符 > [ < 起 始 元 素 下 标 索引 表达 式 > : < 长 度 表达 式 > : < 跨度 表达 式 > ] 








这 里 ，< 起 始 元 素 下 标 索 引 表 达 式 > 指明 了 所 要 获取 数组 片段 的 首 个 
元 素 的 索引 位 置 ;， < 长度 表达 式 > 指 明了 所 要 获取 数组 片段 的 元 素 个 数 ; 
< 跨度 表达 式 > 指 明了 从 当前 元 素 某 取 完 之 后 路 多 少 个 元 素 再 鞭 取 一 次 。 
这 里 ，< 路 上 度 表达 陈 > 可 省 ， 如 果 缺 省 ， 那 么 跨度 默认 为 1。 我 们 现在 举 
一 个 比较 简单 的 例子 ， 假 设 我 们 声明 了 一 个 数组 对 象 A， 那 么 A[1: 3: 
2] 表 示 禁 取 一 个 数组 片段 ， 该 数组 片段 的 起 始 元 素 为 A[1]， 一 共有 3 个 
元 素 ， 然 后 每 跨 两 个 元 系 取 一 次 ， 所 以 最 终 该 数组 片段 的 元 素 依 次 为 
A[1]，A[3]，A[5]。 而 像 A[0: 3] 则 表示 所 茜 取 的 数组 厂 段 起 始 元 系 为 
A[0]， 长 度 为 9， 路 度 为 1， 所 以 萃取 后 的 数组 片段 元 素 依次 为 A[0]， 
A[]，A[2]。 而 如 果 是 A[: ]， 则 表示 以 数组 A 的 所 有 元 系 作为 数组 片段 





的 元 素 。 


从 以 上 操作 可 以 看 到 ， 数 组 片段 类 似 于 取 一 个 数组 的 子 数 组 ， 不 过 
各 位 需要 注意 的 是 ， 数 组 片段 一 般 痢 是 与 数组 片段 进行 操作 ， 也 就 是 说 
等 号 的 左 表 达 式 与 右 表 达 式 都 应 该 是 一 个 数组 片段 。 而 在 C 语 言 的 类 型 
体系 上 ， 数 组 片段 其 实 是 不 具备 类 型 的 ， 因 为 数组 片段 操作 的 本 质 是 将 
右 表 达 式 数组 循环 < 长 度 表 达 式 > 次 ， 然 后 按照 指定 模式 进行 操作 ， 最 后 
将 结果 存 入 左 表达 陈 的 数组 中 。 所 以 说 数组 片段 的 实际 实现 会 根据 当前 
情况 使 用 循环 迭代 拆 分 成 一 个 个 单独 的 标量 操作 ， 或 是 利用 当前 硬件 特 
性 直接 通过 多 线程 或 SIMD 的 操作 来 实现 。 











下 面 我 们 将 通过 3 节 内 容 依 次 描述 数组 片段 的 赋值 操作 、 算 术 计 算 
操作 以 及 函数 调用 的 场合 。 


19.3.1 数组 片段 的 赋值 操作 


正 因为 数组 片段 引入 到 C2X 标 准 的 主要 原因 是 充分 利用 硬件 特性 ， 
发 挥 多 线程 与 SIMD 指 令 集 的 性 能 ， 所 以 在 对 数组 片段 的 赋值 操作 时 ， 
倘 知 左右 表达 式 都 是 同一 个 数组 对 象 ， 那 么 两 者 最 后 产生 的 数组 片段 的 
元 素 位 置 不 应 该 存在 “不 完全 有 登 区 ”的 情况 。 因 为 这 会 产生 元 素 依 赖 而 破 
坏 多 线程 以 及 SIMD 的 独立 操作 。 代 码 清单 19-3 将 描述 数组 片段 的 赋值 
操作 。 





代码 清单 19- 


#include <stdio.h 
#include <intrin. 
typedef m128i 


int main(void) 


3 数组 片段 的 赋值 操作 


> 
h> 


int4; 


// 声明 一 个 ijnt[10] 类 型 的 数 引 


int a[] = { 1, 2, 


日 对 象 a， 
4, 5, 





3, 














// 声明 一 人 的 
sizeof(a[0])]; 


// 将 数组 a 的 后 三 个 元 素 的 值 赋 给 数组 b 的 前 三 个 元 素 


int b[sizeof(a) / 


b[0:3] = a[7:3]; 


// 以 上 操作 即 类 似 于 : 


for (int i = 0; 
b[0O + i] = a 

















l 


i < 3; i++) 
[7 + i]; 














且 对 它 进行 初始 化 











6, 7, 8, 9, 10 }; 


// 这 条 语句 是 将 数组 a 的 全 部 元 素 赋值 给 数组 b 


b[:] = a[:]; 


// 上 述 操作 即 类 似 于 : 


for (int i = 0; 
b[i] = a[il; 





// 这 条 语句 是 将 数组 a 从 起 始 元 素 
// 对 数组 b 的 存放 则 是 从 第 1 个 元 素 开始 ， 
b[1:3:2] = a[0:3: 


// 以 上 操作 即 类 似 于 : 





for (int i = 0; 


I 











T 


i < 10; i++) 





开始 ， 跨 3 个 元 素 ， 取 3 次 元 素 赋 人 














3] 


i < 3; i++) 


b[1 + i*2] = a[lo+i* 3]; 


义 行为 ， 因 为 左 表达 式 的 数组 片段 长 度 


// 以 下 语句 会 





生 未 定 
// i 


b[9:3] = a[5:4]; 





// 这 条 语句 是 合 
// 这 里 对 数 
a[0:5] = a[5:5]; 




















// 这 条 语句 也 是 合法 的 ， 将 数组 a 的 所 有 元 素 做 一 次 赋值 ， 











// 这 种 情况 属 
a[:] = a[0:10]; 





于 对 同一 个 数组 操作 时 














致 














// 这 条 语句 会 产生 未 定义 行为 ， 
// 数组 元 素 从 a[2] 到 a[9] 均 是 


a[1:8] = a[2:8]; 
// 部 分 县 交 为 何不 允 











// 因为 通过 多 线程 或 SIMD 的 操作 会 同时 


























法 的 ， 将 数组 a 的 后 5 个 元 素 赋 值 给 前 5 个 元 素 。 
组 a 的 操作 没有 元 素 苇 交 





I 











时 ， 元 素 全 部 受 交 的 场合 


为 在 操作 过 程 中 ， 














天 
闭 交 元 素 ， 属 于 部 分 车 交 


许 发 生 在 数组 片段 呢 ? 

















读 取 数组 a 的 相关 元 素 ， 





// 然后 一 次 性 





以 向 量 


的 方式 存放 到 左 表 达 式 数组 片段 指定 位 置 。 











// 倘若 存在 全 交情 况 ， 那么 会 











出 现 不 可 


其 待 的 结果 。 























段 设 我 们 现在 处 理 





for (int i = 0; 


器 支持 SSE2， 那么 存在 一 个 类 型 int4， 


上 述 操作 将 可 能 是 这 么 实现 的 : 


i < 2; i++) 








直 给 数组 b; 











每 跨 2 个 元 素 存放 一 次 ， 一 

















存放 3 次 


// 从 a[2 + 4 * i] 元 素 的 地 址 处 一 次 读 取 4 个 元 素 ， 存 放 到 value 中 


int4 value = mm loadu si128((int4*)&a[2 + 4 * i]); 


// 将 value 存 放 到 a[1 + 4 * 开元 素 地 址 处 
_mm_storeu si128((int4*)&a[1 + 4 * i], value); 

















// 这 里 就 会 引发 一 个 问题 ， 第 一 次 迭代 将 a[2] 到 a[5] 元 素 存 放 到 a[1] 到 a[4] 之 后 ， 


// af1] 到 af[4] 的 原本 元 素 值 就 被 改变 了 。 


// 第 二 人 


// a[5] 到 a[8] 原 本 元 素 的 值 就 被 改变 了 
E 多 线程 情况 下 ， 这 两 次 操作 的 顺序 是 不 确定 的 ， 倘 若 第 二 次 迭代 操作 先 执行 ， 


ww 
侨 





// 那么 稍 后 做 




















的 第 一 组 迭代 中 ，a[5] 元 素 的 值 就 不 是 原本 的 值 ， 而 是 变 成 了 a[6] 的 值 了 。 














/** 下 面 我 们 可 以 再 看 一 下 多 维 数组 的 数组 片段 赋值 */ 


int c[5][5] 

















= {1, 2, 3, 4, 5, 6,7, 8, 9, 0}; 


int d[5][5]; 














// 这 里 我 们 完成 了 一 次 向 量 转 置 操作 ， 
// 将 数组 二 维 数组 c 的 第 一 行 元 素 赋值 给 了 数组 d 的 第 一 列 元 素 

















d[0:5][0] = 





























c[9]j[9:5] ; 





代码 清单 19-3 详 细 介 绍 了 数组 片段 赋值 的 方法 、 效 果 以 及 约束 。 


19.3.2 ”数组 片段 的 算术 计算 操作 


数组 片段 的 算术 操作 与 普通 的 标量 计算 类 似 ， 并 且 这 里 的 乘法 操作 
也 是 对 数组 片段 的 每 个 元 素 进行 乘法 操作 ， 而 不 是 作为 向 量 内 积 ， 也 不 
作为 窍 阵 乘法 操作 。 代 码 清单 19-4 列 出 了 数组 片段 的 算术 计算 操作 的 用 


法 与 效果 。 





代码 清单 19-4 数组 片段 的 算术 计算 操作 





#include <stdio 


int main(void) 


.h> 


// 声明 一 个 数组 对 象 a， 它 含有 10 个 元 素 





int a[] = { 


1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }; 








// 声明 一 个 数组 对 象 bp， 它 也 有 140 个 元 素 





int b[10] 


={9 


// 将 数组 D 的 所 有 元 素 赋值 为 1 
b[:] = 1; 


// 将 a[2] 元 素 的 值 分 别 与 b[9]、 2 后 b[2] 相 加 ， 
// 然后 将 结果 存放 到 b[9]、b[1]、b[2] 
b[9:3] += a[2]; 


br 0 与 2 相 乘 ， 然 后 将 结果 存放 到 数组 b 的 各 个 元 素 
:] *= 2 


// 对 数组 a 的 每 个 元 素 做 递增 操作 


a[:]++/ 


// 声明 一 个 二 维 数组 c 
int C[5][5] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 0 }; 


// 声明 一 个 二 维 数组 d 
int d[5][5]; 


// 这 个 没 问题 ， 将 c[9] 的 所 有 元 素 赋值 到 d [90] 中 
d[9][:] = c[e ][:]; 


// 这 条 语句 操作 没有 问题 ， 它 是 定义 良好 的 
dro:2][0:3] = c[1:2][2:3] + df2:2][1:3]; 


// 以 上 操作 相当 于 : 


for (int i = 0; i < 2; i++) 


























for (int j = 0; j < 3; j++) 
d[o + i][0 + j] = c[1 + i][2 + j] + d[2 + i][1 + j]; 


// 以 下 这 条 语句 的 行为 是 未 定义 的 ， 

// 于 取 笋 组 a 的 数组 请 段 的 争 度 与 取 数 组 g 的 数 钼 片 避 的 维度 不 一 致 。 
// 我 们 这 里 意 的 是 ， 一 个 标量 可 以 给 数组 片段 进行 计算 操作 并 赋值 ， 
/但 一 个 数组 片段 参与 计算 与 赋值 时 ， 左右 两 边 的 数组 片段 维度 必须 一 致 
d[0:2][0:2] = a[0:2]; 








































































































19.3.3 ”数组 请 段 用 于 函数 调用 的 情况 


在 函数 调用 时 ， 数 组 片段 用 作 函 数 调 用 实 参 的 场合 非 第 能 体现 数组 
乒 段 的 本 质 特性 以 及 实质 作用 。 这 里 需要 注意 的 是 ， 数 组 片段 用 作 函 数 
实 参 时 ， 函 数 形 参 的 类 型 一 般 为 数组 的 元 系 类 型 ， 而 不 是 一 个 指向 数组 
元 素 指针 类 型 。 代 码 清 单 19-5 描 述 了 数组 片段 用 于 函数 调用 时 的 实 参 传 
递 情 况 。 





代码 清单 19-5 ”数组 片段 用 于 函数 调用 时 的 实 参 传递 情况 





#include <stdio.h> 


// 定义 一 个 函数 MyAdd， 它 的 作用 是 将 两 个 形 参 值 相 加 ， 然 后 将 结果 返 下 
static int MyAdd(int a, int b) 


{ 

















return a + b; 


int main(void) 


// 声明 一 个 数组 对 象 a， 它 含有 10 个 元 素 
int a[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 }; 


// 声明 一 个 数组 对 象 b， 它 也 有 10 个 元 素 
int b[10] = { 11, 12, 13, 14, 15 }; 


// 对 函数 MyAdd 进 行 逐步 调用 ， 然 后 将 结果 依次 赋值 给 b[5] 到 b[9] 元 素 
b[5:5] = MyAdd(a[5:5], b[90:5]); 


A/ 以 上 操作 相当 于 : 
for (int i = 0; i < 5; I++ 
b[5 + i] = MyAdd(a[5 + i], b[© + i]); 















































19.4 其 他 语法 特性 


除了 上 述 提 到 一 些 语 法 特性 和 属性 之 外 ，WG14 工 作 组 也 基本 确定 
了 还 会 将 当前 Clang 编 译 器 已 经 实现 了 的 _has_include 加 入 到 C2X 中 。 





此 外 还 新 增 了 [[maybe_unused]] 属 性 ， 这 个 属性 用 于 修饰 声明 的 静 
态 对 象 、 静 态 函 数 以 及 语句 块 作 用 域内 声明 的 局 部 对 象 。 如 果 这 些 对 象 
声明 之 后 没有 被 使 用 ， 那 么 编译 器 往往 会 给 出 警告 ， 但 用 了 这 个 属性 之 
后 ， 即 便 上 述 声明 的 对 象 或 函数 在 当前 上 下 文中 没有 被 使 用 ， 编 译 吉 也 
不 会 发 出 警 洁 








另外 还 有 对 register 关 键 字 想 做 一 些 拓 展 ， 比 如 让 它 跟 const 限 定 符 连 
用 ， 构 造 一 个 常量 表达 式 。 常 量 表达 式 在 C++11 标 准 中 是 用 constexpr 限 
定 符 来 表示 的 。 具 体 如 何 实 现 ，WG14 工 作 小 组 仍然 在 研究 探讨 中 。 


19.5 本章 小 结 





本 章 对 C 语 言 未 来 的 发 展 做 了 一 些 具 有 前 瞻 性 的 猜想 ， 并 根据 当前 
WG14 的 工作 情况 做 了 一 些 汇总 。 不 管 C 语 言 在 5 年 后 变 成 怎样 ， 它 不 会 
一 下 子 变 得 面目 全 非 ， 语 法 体系 上 也 不 会 有 非常 大 幅度 的 修改 ， 而 是 会 
充分 考虑 回 前 兼容 ， 这 一 点 与 C++ 那 种 大 刀 阔 和 痉 的 演化 有 上 所 不 同 。 





因此 ， 我 们 可 以 相信 ， 未 来 的 C 语 言 不 会 变 得 难 学 ， 它 仍然 会 是 一 
门 相对 比较 简单 、 高 效 的 高 级 编程 语言 ， 并 且 继 续 作 为 工业 标准 为 各 个 
生产 、 设 计 、 计 算 平 台所 使 用 。 








C 语 言 所 有 语法 特性 的 介绍 到 此 结束 。 下 面 两 音 将 通过 两 个 不 算 太 
大 但 功能 完整 的 设计 项 目 来 展示 一 下 如 何 用 C 语 言 做 实际 项 目 。 





第 五 希 ”项 目 实 践 篇 





stdalign.h 库 



















Bu 项 目 实 践 篇 
UTF-8 编 码 格式 
ing.h es 
UTF-16 编 码 格式 
头 文件 的 使 用 


stdbool.h 库 


主 函 数 参 数 的 
指向 函数 的 指针 的 使 用 


具有 外 部 连接 的 全 局 
函数 的 声明 与 调用 





函数 的 递归 调用 


第 20 章 ”制作 UTF-8 与 UTF-16 编 码 字 符 串 
的 转 码 器 


UTF-8 字 符 编码 格式 与 UTF-16 字 符 编码 格式 都 是 当今 非常 常用 的 字 
符 编码 格式 ， 它 们 都 是 根据 Unicode 这 一 计算 机 工业 编码 标准 进行 制定 
的 。 当 今 现代 化 计算 机 操作 系统 几乎 都 使 用 UTF-8 作 为 其 默认 的 系统 字 
符 编码 格式 ， 大 部 分 集成 开发 环境 也 几乎 默认 使 用 UTF-8 编 码 格式 。 
Google 在 2008 年 的 报告 中 指出 ， 在 互联 网 上 ，UTF-8 编 码 已 经 成 为 
HTML 文 件 使 用 最 多 的 字符 编码 格式 。 





在 当今 许多 文本 解析 上 ， 大 多 都 以 UTF-16 编 码 来 收集 源 文件 以 及 
文本 上 的 字符 ， 因 为 UTF-16 编 码 格式 的 可 变性 小 ， 而 且 大 部 分 情况 下 2 
个 字 节 即 可 表示 一 个 常用 字符 ， 因 此 用 UTF-16 编 码 格式 的 字符 串 一 来 
不 怎么 耗费 内 存 ， 二 来 能 方便 地 确定 字符 串 的 长 度 ， 从 而 可 以 方便 地 进 
行 插 入 、 修 改 、 删 除 等 操作 。 因 此 对 于 字符 串 的 编辑 而 言 ， 它 比 UTF-8 
更 有 具 优 势 。 


下 面 ， 我 们 将 先 分 别 介 绍 UTF-8 编 码 格 式 与 UTF-16 编 码 格式 的 相关 
知识 ， 然 后 再 具体 介绍 笔者 已 经 实现 的 两 者 之 间 的 转换 工具 以 及 其 他 操 
作 工 具 。 





20.1 UTF-8 字 符 编码 格式 








UTF-8 字 符 编 码 是 一 种 变 长 的 字符 编码 格式 ， 可 兼容 之 前 已 有 的 
ASCII 编 码 格式 。 它 在 1993 年 1 月 首次 官方 发 布 ， 当 时 UTF-8 编 码 的 字符 
长 度 最 多 可 长 达 6 个 字 节 ， 也 就 是 说 当时 一 个 UTF-8 编 码 的 字符 可 占用 1 
到 6 个 字 节 ， 比 如 如 果 一 个 字符 是 与 ASCII 码 相 兼 容 的， 那么 它 就 只 占 1 
个 字 节 。 到 了 2003 年 11 月 ，UTF-8 做 了 一 些 改动 然后 再 次 发 布 ， 这 是 为 
了 让 UTF-8 与 UTF-16 能 完整 兼容 转换 ， 对 UTF-8 的 表达 范围 做 了 裁 覃 ， 
将 它 的 最 大 长 度 缩减 到 了 4 个 字 节 ， 并 且 要 求 它 必 须 满足 RFC 3629 标 准 
中 的 约束 。 现 在 我 们 用 的 UTF-8 编 码 格式 都 是 基于 2003 年 发 布 的 标准 实 
现 的 。 

















我 们 上 面 探 讨 了 UTF-8 是 一 种 变 长 编码 格式 ， 其 长 度 在 1 个 字 贡 到 4 
个 字 节 之 间 ， 那 么 一 个 UTF-8 编 码 的 字符 是 如 何 表达 的 呢 ? 一 个 UTF-8 
编码 的 字符 由 两 部 分 构成 ， 第 一 部 分 是 用 于 标识 该 字符 一 共 需 要 多 少 字 
节 的 前 级 比特 标志 。 这 个 前 级 比特 要 看 第 一 个 字 节 的 高 5 位 ， 如 果 是 0， 
表示 当前 字符 由 1 个 字 节 构成 ; 如 果 是 3， 表 示 当 前 字符 由 2 个 字 节 构 
成 ; 如 果 是 7 表示 当前 字符 由 3 个 字 节 构成 ， 如 果 是 15， 则 表示 当前 字符 
由 4 个 字 节 构成 。 其 实 这 也 就 意味 着 通过 观察 第 一 个 字 节 的 前 导 1 的 个 数 
即 可 判断 出 当前 字符 由 多 少 个 字 节 构成 。 第 二 部 分 则 是 该 字符 的 码 点 


(code point) 。 所 谓 码 点 就 是 用 于 表示 一 个 特定 字符 具有 实际 意义 的 编 





























码 值 ， 该 编码 值 是 由 Unicode 组 织 制定 的 。 比 如 对 于 一 个 兼容 ASCII 码 的 
UTF-8 编 码 字符 A 来 说 ， 其 完整 的 二 进 制 编码 为 01000001。 可 见 其 前 导 1 
的 个 数 为 0， 说 明 它 就 由 1 个 字 节 构成 。 然 后 它 的 码 点 即 为 1000001， 即 
十 六 进 制 的 0x41。 表 20-1 列 出 了 UTF-8 不 同 字 节 数 构成 的 字符 编码 信 








表 20-1 UTEF-8 编 码 信 息 表 


起 始 码 点 | 最 后 码 点 字 节 1 字 节 4 


Ox0000 Ox007F (XxXXRXX N/A 








Ox0080 Ox07FF 110xxxxx ] 0XXXXXX N/A 





Ox0800 OxFFFF 1110xxxx ] OXXXXXX ] 0XXXXXX N/A 








0x10000 Ox10FFFF 11110xxx ] OXXXXXX 0 ] 0OXXXXXX 


表 20-1 中 ，x 符 号 表示 码 点 的 一 个 比特 。 我 们 看 到 ， 为 了 与 ASCII 码 
完全 兼容 ，Unicdoe 在 制定 UTF-8 编 码 时 ， 将 没有 任何 前 导 1 的 字 节 表示 
为 单字 节 UTF-8 编 码 ， 然 后 从 由 2 个 字 节 构成 的 UTF-8 编 码 开始 ， 有 多 少 
个 前 导 1 就 表明 当前 字符 占用 多 少 个 字 节 。 然 后 ， 对 于 一 个 字符 的 UTF- 
8 编码 ， 后 续 字 节 的 编码 都 以 10 开 头 ， 这 么 做 的 好 处 是 可 用 于 校 验 当 前 
字符 编码 的 正确 性 ， 也 可 以 避免 解析 到 用 于 表示 UTF-8 字 符 串 的 结束 符 
\0 字 符 ， 因 为 它 的 编码 值 为 0， 而 有 了 前 导 10 比 特 ， 则 当前 字 节 的 最 小 
值 为 0x80， 所 以 不 可 能 会 出 现 0 的 情况 。 这 种 特性 也 称 为 自 同步 (self- 
synchronizing ) 特性 ， 它 可 在 遍历 UTF-8 编 码 字 符 串 的 时 候 方便 校 验 当 
前 字符 编码 的 正确 性 。 











我 们 下 面 举 一 个 具体 例子 来 说 明 一 个 字符 的 UTF-8 编 码 是 如 何 构成 
的 ， 我 们 这 里 用 欧元 符号 € 进 行 举例 说 明 。 
在 Unicode 标 准 中 ， 欧 元 符号 € 的 码 点 为 0x*2?0AC。 那 么 可 以 根据 以 


下 步骤 来 构造 出 其 UTF-8 编 码 。 


1) 根据 表 20-1 中 列 出 的 模式 ， 由 于 0x20AC 这 个 码 点 坐落 于 0x0800 
到 0xFFFF 之 间 ， 因 此 它 最 终 的 UTF-8 编 码 应 该 由 3 个 字 节 构成 。 因 此 我 
们 后 面 看 表 20-1 的 第 3 行 。 


2) 我 们 将 0x20AC 用 二 进 制 数 来 表示 ， 为 0010000010101100。 随 后 
我 们 将 这 些 比特 插入 到 相应 字 节 中 。 


3) 字 节 1 具有 4 位 固定 前 导 比 特 1110， 而 低 4 位 用 于 存放 码 点 的 比 
特 ， 因 此 字 节 1 正好 可 以 将 码 点 的 高 4 位 放 进 去 ， 那 么 得 到 11100010。 


4) 字 节 2 具有 2 个 固定 的 前 导 比 特 10， 可 存放 6 位 码 点 比特 ， 因 此 把 
后 续 6 位 码 点 的 二 进 制 比特 插入 进去 得 到 10000010。 


5) 字 节 3 具有 两 个 固定 的 前 导 比 特 10， 可 存放 6 位 码 点 比特 ， 因 此 
我 们 可 以 将 剩余 的 6 位 码 点 二 进 制 比特 插入 进去 得 到 10101100。 


这 样 ， 我 们 整理 得 到 欧元 符号 € 的 UTF-8 编 码 的 二 进 制 表示 为 : 
111000101000001010101100。 用 十 六 进 制 表 达 则 是 0xE282AC。 


20.2 UTF-16 字 符 编 码 格 式 





在 20 世 纪 80 年 代 ， 人 们 开发 出 了 双 字 节 字 符 编 码 格式 ， 那 时 就 将 它 
称 为 “Unicode”。 随 后 ， 随 着 各 种 语言 符号 的 加 入 ， 人 们 很 快 发 现 单单 
用 双 字 节 来 表示 一 个 字符 远 远 不 够 ， 而 此 时 已 经 有 许多 开发 商 基 于 这 种 
双 字 节 字 符 编码 做 了 许多 大 型 项 目 。 比 如 Java 一 开始 就 是 基于 这 种 双 字 
节 编 码 的 字符 格式 的 ， 所 以 它 能 够 支持 使 用 汉字 或 其 他 文字 来 定义 某 个 
标识 符 ， 而 不 仅仅 用 ASCII 码 字符 。 到 了 1996 年 ，Unicode 标 准 开发 了 
2.0 版 本 ， 将 原先 的 双 字 节 字 符 编码 改造 为 变 长 的 字符 编码 格式 ， 称 为 
UTF-16 字 符 编码 ， 而 之 前 的 “Unicode” 则 改称 为 “UCS-2” 编 码 格式 ， 其 中 
UCS 表 示 通 用 字符 集 。 




















因此 ，UTF-16 也 是 变 长 的 Unicode 字 符 编 码 格 式 ， 不 过 它 与 UTF-8 
不 同 的 是 ， 它 只 有 两 种 长 度 ， 一 种 是 占用 2 字 节 的 编码 格式 ， 这 种 编码 
格式 与 UCS-2 完 全 兼容 ， 还 有 一 种 就 是 4 字 节 编码 格式 。UTF-16 也 有 “人 码 
点 ”这 个 概念 ， 并 且 一 个 字符 的 码 点 与 UTF-8 编 码 中 的 码 点 值 都 是 一 样 
的 ， 因 为 这 些 都 是 由 Unicode 组 织 来 制定 的 。 

















UTF-16 编 码 根据 字符 对 应 的 码 点 值 ， 由 三 种 不 同 区 间 范 围 而 做 出 
了 不 同 的 定义 。 


(1) 从 0x0000 到 0x7FFF 以 及 从 0xE000 到 0xFFFF 两 个 区 间 范 围 


坐落 在 这 两 个 区 间 范 围 内 的 UTF-16 编 码 表示 起 来 非常 简单 ， 就 是 
当前 字符 所 对 应 的 码 点 值 本 身 。 这 也 是 UTF-16 与 UCS-2 相 兼容 的 区 间 。 
Unicode 将 坐落 于 这 两 个 区 间 范 围 内 的 码 点 称 为 基本 多 语言 平面 (Basic 
Multilingual Plane) ， 简 称 BMP。 比 如 ， 像 美元 $ 符 号 ， 它 在 Unicode 中 
的 码 点 与 ASCI 码 中 的 一 样 ， 均 为 0x24， 所 以 它 的 UTF-16 编 码 即 为 
0x0024。 注 意 ， 尽 管 它 用 一 个 字 节 即 可 表示 ， 但 对 于 UTF-16 来 说 ， 仍 
然 需 要 占用 2 个 字 节 。 而 欧元 符号 在 Unicode 中 的 码 点 为 0x20AC， 所 以 


它 对 应 的 Unicode 编 码 值 即 为 0x20AC。 











(2) 从 0x010000 到 0x10FFFF 范 围 





我 们 看 到 ， 这 个 区 间 内 的 码 点 用 两 个 字 节 已 经 无 法 表达 ， 所 以 对 于 
UTF-16 编 码 而 言 就 需要 动用 4 个 字 节 进行 描述 。 这 个 范围 区 间 又 称 为 补 
充 平面 (Supplementary Plane) ， 像 Emoji、 一 些 历史 脚本 、 非 常 少 用 的 
汉字 等 都 坐落 于 此 平面 中 。 那 么 在 此 范围 内 的 UTF-16 编 码 应 该 如 何 计 
算 呢 ?可 以 通过 以 下 三 步 来 获得 : 








1) 将 人 码 点 值 减 去 0x010000， 然 后 取 差 的 低 20 位 ， 使 得 结果 留 在 
0x000000 到 0x0OFFFFF。 


2) 取 步 又 1 所 得 结果 的 高 10 位 ， 范 围 在 0x0000 到 0x03FF， 将 它 加 上 
0xD800， 得 到 第 一 个 16 位 编码 单元 ， 这 也 称 为 高 位 蔡 换 ， 该 值 的 范围 


在 0xD800 到 0xDBFF。 


3) 对 于 由 步 又 1 所 得 结果 的 低 10 位 (范围 也 在 0x0000 到 0x03FF》， 
将 它 加 上 0xDC00， 得 到 第 二 个 16 位 编码 单元 ， 这 也 称 为 低位 蔡 换 ， 该 
值 的 范围 在 0xDC00 到 0xDEFFF。 


我 们 这 里 举 两 个 例子 来 说 明码 点 落 在 0x010000 到 0x10FFFF 范 围 字 
符 的 UTF-16 编 码 如 何 表 示 。 首 先 我 们 看 一 个 德 撤 律 字 母 久 ， 该 字母 的 码 
点 定义 为 0x10437。 第 一 步 ， 我 们 先 将 该 码 点 值 减 去 0x10000， 得 到 
0x0437。 取 该 值 的 低 20 位 ， 得 到 二 进 制 值 00000000010000110111。 然 
后 ， 取 它 高 10 位 一 一 0000000001， 对 应 十 六 进 制 值 为 0x0001， 将 它 加 上 
0xD800 之 后 得 到 0xD801， 因 此 它 的 第 一 个 16 位 编码 单元 的 值 就 是 
0xD801。 最 后 ， 取 20 位 值 的 低 10 位 ， 得 到 0000110111， 对 应 十 六 进 制 
值 为 0x0037， 将 它 加 上 0xDC00 得 到 0xDC37， 因 此 它 的 第 二 个 16 位 编码 
单元 的 值 就 是 0xDC37。 最 后 我 们 得 到 整个 德 撤 律 字母 鼠 的 UTF-16 编 码 
表示 为 : 0xD801 DC37。 








第 二 个 例子 是 古代 汉字 “〈 同 “ 碎 >) ， 它 的 码 点 定义 为 0x24B62。 
第 一 步 ， 我 们 先 将 该 码 点 值 减 去 0x10000， 得 到 0x14B62。 第 二 步 取 它 的 


低 20 位 ， 得 到 二 进 制 值 00010100101101100010。 第 三 步 ， 取 前 10 位 ， 得 








到 0001010010， 对 应 十 六 进 制 值 为 0x0052， 将 它 加 上 0xD800 之 后 得 到 

0xD852， 因 此 第 一 个 16 位 编码 单元 的 值 就 是 0xD852。 第 四 步 ， 取 刚才 

所 得 20 位 值 的 低 10 位 ， 得 到 1101100010， 对 应 十 六 进 制 值 为 0x0362， 将 
它 加 上 0xDC00 得 到 0xDF62， 因 此 第 二 个 16 位 编码 单元 的 值 就 是 





0xDF62。 最 终 ， 该 汉字 的 UTF-16 编 码 表示 为 0xD852 DF62。 


(3) 范围 从 0xD800 到 0xDFFF 的 区 间 





Unicode 永 久保 留 了 这 两 个 区 间 不 允许 定义 任何 有 意义 的 字符 人 码 
点 。 因 为 我 们 通过 上 面 从 0x010000 到 0x10FFFF 范 围 的 UTF-16 编 码 表 示 
法 就 已 经 知道 这 个 区 间 用 于 4 字 节 UTF-16 编 码 的 高 位 蔡 换 与 低位 蔡 换 区 
间 ， 所 以 不 能 用 来 定义 码 点 值 ， 否 则 会 在 编码 上 产生 歧义 。 





20.3 ”代码 示例 


我 们 前 面 己 经 将 UTF-8 编 码 规则 以 及 UTF-16 编 码 规则 完整 地 描述 过 
了 。 下 面 我 们 就 要 开始 实现 对 这 两 种 编码 方式 的 相互 转换 并 制作 其 他 一 
些 常用 操作 工具 函数 。 


首先 要 声明 的 是 ， 这 份 代码 示例 可 以 从 笔者 的 GitHub 上 获得 完整 的 
代码 资源 : https://github.com/zenny-chen/UTF-8-and-UTF-16-string- 


utilities。 


该 项 目 由 三 个 文件 构成 ，zennyChar.h 包 含 了 编码 转换 工具 的 对 外 函 
数 接口 ，zennyChar.c 用 于 对 编码 转换 工具 的 相关 函数 进行 实现 ， main.m 
是 一 个 Objective-C 源 文件 ， 因 为 Objective-C 中 的 字符 串 对 象 自身 支持 
UTF-16 编 码 ， 所 以 我 们 可 以 用 来 校 验 结果 是 否 正确 。 如 果 我 们 在 macOS 
下 测试 这 些 人 代码， 那么 可 以 创建 一 个 Foundation 控 制 台 工程 即 可 编译 运 
行 ， 倘 兰 在 Ubuntu 系 统 下 ， 那 么 可 以 根据 笔者 的 这 篇 博文 来 安装 
Objective-C 的 运行 时 环境 : http:/www.cnblogs.com/zenny- 











chen/p/4080067.html。 
下 面 ， 我 们 就 先 来 看 zennyChar.h 头 文件 的 内 容 ， 见 代码 清单 20-1。 


代码 清单 20-1 zennyChar.h 头 文件 内 容 





#ifndef UTF_trans_zennyChar_h 
#define UTF_trans_zennyChar_h 


#include <stdbool.h> 
#include <stdint.h> 
#include <stddef.h> 


pA 

* 将 UTF16 字 符 串 转 为 UTF8 字 符 串 
@param pUTF16 指向 目的 存放 UTF16 字 符 串 的 缓存 地 址 

@param pUTF8 指向 源 UTF8 字 符 串 缓存 首 地 址 

* @param pUTF16Length 指向 存放 的 UTF16 字 符 串 长 度 的 变量 首 地 址 ;如 果 转 换 成 功 ， 
且 此 指针 不 空 ， 那么 将 最 终 UTF16 字 符 串 的 长 度 存放 进去 

* re ue 若 转 换 成 功 返 回 true， 否 则 返回 false 











* 

















* 














































































































a bool ZennyUTF8ToUTF16(uint16_t pUTF16[], const char *pUTF8, 
size_t *pUTF1i6Length); 


J 

* 从 UTF8 字 符 串 获 得 相应 UTF16 字 符 串 的 长 度 

* @param utf8Str 指向 UTF8 字 符 串 首 地 址 

* @return 相应 UTF16 字 符 串 长 度 

A 

extern size_t ZennyGetUTF16LengthFromUTF8(const char *utf8Str); 























人 
* 将 UTF16 字 符 串 转 为 UTF8 字 符 串 
* @param pUTF8 指向 目的 存放 UTF8 字 符 串 的 缓存 首 地 址 
* @param pUTF16 指向 源 存放 UTF16 字 符 串 的 缓存 首 地 址 
* @param pUTF8Length 指向 存放 目的 UTF8 字 符 串 长 度 的 变量 指针 ;， 当 转换 成 功 时 ， 
若 DUTF8Length 不 空 ， 则 将 转换 后 的 UTF8 字 符 串 的 长 度 存 放 进 去 
* @return 若 转 换 成 功 返回 true， 否则 返回 false 
A 
extern bool zennyUTF16ToUTF8(char pUTF8[], const uint16_t *pUTF16, 
size_t *pUTF8Length); 













































































三 
































py A 
* 从 UTF16 字 符 串 获得 相应 UTF8 字 符 串 的 长 度 
* @param utf16Str 指向 源 UTF16 字 符 串 的 首 地 址 








* @return 相应 UTF8 字 符 串 的 长 度 
4 
extern Size _t ZennyGetUTF8LengthFromUTF16(const uint16_t *utf1i6Str); 





A 

* 获得 指定 UTF16 字 符 串 的 长 度 

* @param s UTF16 字 符 串 首 地 址 

* @return UTF16 字 符 串 长 度 

*/ 

extern size_t ZennyUTF16StrLen(const uint16 t *s); 


























人 
”将 dst 所 存放 的 字符 串 内 容 与 src 所 秆 放 的 字符 串 内 容 拼接 〈dst 内 容 为 头 ，src 内 容 为 尾 ) ， 
然后 将 结果 存放 入 dst 的 缓存 中 

* @warning dst 必 须 有 足够 的 存储 空间 来 存放 结果 字符 串 内 容 

* @param dst 指向 目的 UTF16 字 符 串 以 及 作为 源 UTF16 字 符 串 的 头 部 

* @param src 指向 源 UTF16 字 符 串 尾部 内 容 

* @return 如 果 拼 接 成 功 ， 指 向 dst; 否则 指向 空 

WA 

extern const uint16 _t* ZennyUTF1i6StrCat(uint16 t dst[], const uint16 t src[]); 
















































































#endif 





代码 清单 20-1 已 经 将 本 项 目 所 提供 的 字符 串 操 作 工 具 全 都 列 出 来 
了 。 这 其 中 不 仅 包 含 了 UTF-8 编 码 字符 串 转 UTF-16 编 码 字符 串 ， 而 且 还 
包含 了 获取 UTF-8 字 符 串 的 长 度 以 及 UTF-16 字 符 串 的 长 度 ， 还 有 UTF-16 
编码 字符 串 的 拼接 。 


代码 清 蛙 20-2 将 列 出 这 些 对 外 接口 函数 的 实现 。 





代码 清单 20-2 ”UTF-8 与 UTF-16 编 码 工具 外 部 函数 接口 的 实现 





#include "zennyChar.h" 
bool ZennyUTF8ToUTF16(uint16_t pUTF16[], const char *pUTF8, size_t *pUTF1i6Length) 


if(pUTF16 == NULL || pUTF8 == NULL) 
return false; 


size_t orgIndex = 0，dstIndex = 0; 
char ch 


while((ch = pUTF8[orgIndex]) != '\0') 
{ 


Uint32_t result = 0; 
int length = 0; 


// counting leading '1' for number of UTF-8 bytes 
uint32_t firstByteFlag = (uint32 t)ch & Oxfc,; 
while( (firstByteFlag & 0x80) != 0) 

{ 


firstByteFlag <<= 1; 
length++; 


// 若 长 度 为 0， 则 直接 为 兼容 的 ASCII 码 
if(length == 0) 








pUTF16[dstIndex++] = ch,; 
orgIndex++; 
continue; 


} 
// 对 于 mac0S 系 统 ， 采 用 的 是 大 端的 Unicode 


// 先 接 第 个 字 节 的 剩余 有 效 比特 
result (uint32_t)ch & (OxffU >> (length + 1)); 




































































// 对 于 UTF-8 字 节 数 小 于 4 的 ， 说 明 是 基本 多 语言 平面 (BMP) ， 对 应 于 Unicode 一 定 为 
// 两 个 字 节 。 对 于 大 于 3 字 节 数 的 UTF- 人 

int base,; 

switch(length) 

{ 


case 2: 


base = 11; 
break; 


case 3: 
base = 16; 
break; 


case 4: 
default: 
base = 21; 
break ; 
} 
int shiftedBitPosition = base - (8 - (length + 1)); 
result <<= shiftedBitPosition; 
int i = 1; 


// 再 拼接 其 余 字 节 的 比特 位 
do 



































shiftedBitPosition -= 6; 
result |= ((uint32_t)pUTF8[++orgIndex] & QOx3f) << shiftedBitPosition; 


} 
while(i < length); 

















// 对 于 UTF-8 字 节 数 小 于 4 的 ， 说 明 是 基本 多 语言 平面 (BMP) ， 
// 对 应 于 Unicode 一 定 为 两 个 字 节 
if(length < 4) 
pUTF16[dstIndex++] = result 
else 


{ 
































// 对 于 大 于 3 字 节 数 的 UTF-8， 则 采用 高 低 交 蔡 对 码 点 格式 
result -= Ox00010000; 

uint16_t high = result >> 10; 

uint16_t low = result - (high << 10); 
pUTF1i6[dstIndex++] = high + Oxd800; 
pUTF1i6[dstIndex++] = low + 0xdc00 








} 


orgIndex++; 


} 
pUTF1i6[dstIindex] = u'\0O'; 


if(pUTF16Length != NULL) 
*pUTF16Length = dstIndex; 


return true 


} 
size_t ZennyGetUTF16LengthFromUTF8(const char *utf8Str) 


if(utf8str == NULL) 
return 9; 


size t orgIndex = 0, dstLength = 0; 
char ch 


while((ch = utf8Str[orgIndex]) != '\0') 


int length = 0; 


// 对 U 


uint32_t firstByteFlag = (uint32 t)ch & 


while( 











TF-8 字 节 序列 计算 前 导 1 的 个 数 ， 有 











(firstByteFlag & 0x80) != 0) 


firstByteFlag <<= 1; 
length++; 


} 


if(length == 0) 
length = 1; 


orgIndex += Length 


int addition = length > 3? 2 : 1; 
dstLength += addition; 


} 


return dstLength; 


} 

















bool ZennyUTF16ToUTF8(char pUTF8[], const uint16_t *pUTF16, 


if(pUTF8 == NULL || pUTF16 == NULL) 
return false; 


size_t orgIndex = 0, dstIindex = 0; 
uint16_t ch; 








while((ch = puUTF1i6[orgIndex]) != u'\0') 
{ 
// 处 理 ASCII 码 兼容 情况 
if(ch < Ox80) 
{ 
pUTF8[dstIndex++] = ch; 
orgIndex++; 
continue,; 
} 
// 处 理 16 位 Unicode 的 情况 (最 多 3 字 节 UTF-8) 
if(ch < 0xd800 || ch >= 0xe000) 


if((ch & gxf800) == 0) 


// 高 5 位 为 90， 说 明 是 2 字 节 UTF-8 


uint8_t value = (ch >> 6) | OxcoO; 


pUTF8[dstIndex++] = Value 


Value = (ch & Ox3f) | Ox80; 
pPUTF8[dstIndex++] = value; 


} 

else 

{ 
// 否则 为 3 字 节 UTF-8 
uint8_t value = (ch >> 12) | Oxeo0; 
pUTF8[dstIndex++] = value; 
value = (ch >> 6) & 0x3f; 
Value |= Ox80; 
pUTF8[dstIndex++] = value,; 
value = ch & QOx3f; 
Value |= Ox80; 
puUTF8[dstIndex++] = value; 

} 


size_t *pUTF8Length) 


else 


{ 
// 处 理 21 位 Unicode 的 情况 
uint32_t high = ch - 0xd800 
uint32_t low = pUTF16[++orgIndex] - Oxdc0o0,; 
Uint32_t result = low + (high << 10); 
result += 0X00010000 ; 
uint8_t value = (result >> 18) | 0xfg0; 
pUTF8[dstIndex++] = value; 
value = (result >> 12) & Ox3f; 
Value |= Ox80; 
pUTF8[dstIndex++] = value; 
value = (result >> 6) & Ox3f; 
Value |= Ox80; 
pUTF8[dstIndex++] = value; 
value = (result & 0x3f) | Ox80; 
pUTF8[dstIndex++] = value; 
} 
orgIndex++; 


} 
pUTF8[dstIndex] = '\0'，; 


if(pUTF8Length != NULL) 
*pUTF8Length = dstIndex; 


return true; 


} 
size_t ZennyGetUTF8LengthFromUTF1i6(const uint16 _t *utf16Str) 


if(utf16Str == NULL) 
return 0; 


size_t orgIndex = 0, dstLength = 0; 
uint16_t ch; 


while((ch = utf1i6Str[orgIndex]) != u'\0') 





// 处 理 ASCII 码 兼容 情况 
if(ch < Ox80) 


dstLength++; 
orgIndex++; 
continue,; 


} 


// 处 理 16 位 Unicode 的 情况 (最 多 3 字 节 UTF-8) 
if(ch < 0xd800 || ch >= 0xe000) 


if((ch & 0xf800) == 0) 
// 高 5 位 为 0， 说 明 是 2 字 节 UTF-8 
dstLength += 2; 

} 


else 


dstLength += 3; 


else 


// 否则 为 4 字 节 UTF-8 
dstLength += 4; 
orgIndex++; 


orgIndex++; 


} 
return dstLength; 


size_t ZennyUTF1i6StrLen(const uint16 t *s) 


if(s == NULL) 
return 0; 


size_t index; 
for(index = 0; s[index] != Uu'\0'; index++); 


return index; 


} 
const Uint16_t* ZennyUTF16StrCat(uint16 t dst[], const uint16 t src[]) 


if(dst == NULL || src == NULL) 
return NULL; 


size _t index = ZennyUTF1i6StrLen(dst); 


for(size t i = 0; src[i] != Uu'\0'; i++) 
dst[index++] = src[il]; 


dst[index] = u'\0'; 


return dst; 





代码 清单 20-2 给 出 了 所 有 外 部 接口 函数 的 完整 的 实现 ， 并 且 在 一 些 
关键 部 分 都 写 了 注释 。 由 于 编码 转换 的 算法 本 吴 并 不 太 复 杀 ， 上 所 以 这 段 
代码 注释 量 不 多 ， 而 且 很 容易 束 能 看 异 。 





代码 清单 20-3 给 出 了 针对 此 编码 转换 工具 的 测试 。 


代码 清单 20-3 ”编码 转换 工具 的 测试 





#import <Foundation/Foundation.h> 
#include <string.h> 


#include "zennyChar.h" 


int main(int argc, const char * argv[]) 


{ 























// 声明 一 个 s 字 符 数 组 ， 用 于 存放 一 个 UTF-8 字 符 串 
const char s[] = u8" 你 好 ， 世 界 ! aByDHello, world!"; 























printf("The length is: %zu, and the content is: %s\n", strlen(s), s); 


// 使 用 NSString 对 象 来 存放 这 个 字符 串 ， 并 且 str 对 象 引用 所 包含 的 字符 编码 已 经 转 为 了 UTF-16 
NSString *str = [NSString stringwithUTF8String:s]; 
NSLog(@"The length is: %zu, and the content is: %@", [str length], str); 




























































































// 下 面 用 我 们 自己 实现 的 UTF-8 转 UTF-16 的 方法 进行 对 比 测试 

unichar buffer[64]; 

size_t length,; 

if(ZennyUTF8ToUTF16(buffer, s, &length)) 
NSLog(@"\nThe transformed UTF16 length is: %zu, and the string is: %@", 
length, [NSString stringwithCharacters:buffer length:length]); 





NSLog(@"The UTF16 string length from UTF8 is: %zu, and the original 
UTF16 string length is: %zu", ZennyGetUTF1i6LengthFromUTF8(s), 


ZennyUTF1i6StrLen(buffer)); 
// 再 将 UTF-16 编 码 的 字符 串 再 转 
char chBuffer[64]; 
ZennyUTF16ToOUTF8(chBuffer, buffer, &length); 


printf("\nThe transformed UTF8 length is: %zu, and the string is: %s\n", 
length, chBuffer); 
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UTF-8 编 码 的 字符 

















length = ZennyGetUTF8LengthFromUTF16(buffer); 
printf("The UTF8 length from UTF16 is: %zu\n\n", length); 


// 最 后 测试 一 下 ZennyUTF16StrCat 函 数 
ZennyUTF16StrCat(buffer，Uu"OD 拜 拜 一 " ) ) 














length = ZennyUTF16StrLen(buffer ) ， 
NSLog(@"The UTF16 length is: %zu, and the content is: %@", length, 
[NSString stringwithCharacters:buffer length:length]); 


return 0; 





代码 清单 20-3 中 的 测试 字符 串 中 既 包 含 中 文 、 英 文 、 希 腊 文 ， 同 时 
还 包括 了 Emoji， 因 此 测试 涉及 的 范围 比较 广 。 


20.4 ”本 章 小 结 


本 章 详细 介绍 了 UTF-8 编 码 格式 以 及 UTF-16 编 码 格式 的 具体 规格 。 
通过 一 个 完整 的 项 目 我 们 介绍 了 如 何在 UTF-8 编 码 的 字符 串 与 UTF-16 编 
码 的 字符 串 之 间 相 互 转换 ， 如 何 获取 UTF-16 字 符 串 的 长 度 等 。 通 过 这 
个 项 目 各 位 能 够 学 习 到 C 语 言 程 序 设计 中 的 常用 技巧 ， 比 如 对 外 函数 接 
口 通过 一 个 头 文件 进行 说 明 ， 还 有 C 语 言 代 码 中 对 函数 、 对 象 命名 的 习 
惯 规则 ， 等 等 。 








尽管 本 项 目的 实际 算法 不 算 复 杀 ， 但 是 它 已 经 具备 一 定 的 模 英 化 设 
计 思 想 ， 我 们 直接 将 它 作 为 库 使 用 也 完全 没有 问题 。 


第 21 章 ”制作 控制 人 台 计 算 器 


我 们 在 前 一 章 介 绍 了 UTF-8 与 UTF-16 之 间 相互 转 码 的 算法 工具 ， 如 
果 说 这 个 项 目 还 算 比 较 简单 的 话 ， 那 么 本 章 将 要 介绍 的 项 目 将 会 复杂 不 
少 。 我 们 将 在 本 章 给 大 家 介绍 如 何 制作 基于 控制 台 的 计算 器 工具 。 


本 计算 喜 的 功能 特性 有 以 下 几 点 。 


1) 用 户 通过 一 个 不 带 空格 的 完整 的 字符 串 作为 该 程序 的 参数 ， 该 
字符 串 就 是 我 们 所 要 制作 的 程序 对 它 进行 解析 的 算术 表达 式 。 假 定 我 们 
构建 出 来 的 程序 名 为 calculator， 那 么 我 们 在 控制 台 输 入 calculator 
1+2+3*4， 然 后 输入 回 车 ， 我 们 就 能 看 到 计算 结果 15。 


2) 本 计算 器 支持 的 运算 操作 包括 加 法 操作 (+) 、 减 法 操作 
(-) 、 乘 法 操作 (*) 、 除 法 操作 〈/) ， 求 模 操作 〈9%) ， 指 数 求 暴 操 
作 (^) 以 及 括号 操作 。 这 里 要 注意 的 是 ， 有 些 控制 台 将 圆 括号 视 作 具 
有 特殊 意义 的 符号 ， 因 此 不 能 作为 程序 的 输入 参数 给 出 ， 而 我 们 这 里 同 
时 文 持 圆 括号 和 方 括号 作为 括号 使 用 ， 在 解析 前 会 有 了 预 处 理 将 磁 到 的 方 
括号 全 者 转换 为 圆 括号 。 





3) 本 计算 器 支持 以 下 这 些 常 用 数学 函数 : sin 正弦 函数 ) 、 
cos (余弦 函数 ) 、tan 正切 了 消 数 ) 、cot( 余 切 函 数 ) 、sinh 〈 双 曲 正 


弱 函 数 ) 、cosh《〈 双 曲 余弦 函数 ) 、tanh〈 双 曲 正 切 函 数 ) 、asin (反正 
弱 函 数 ) 、acos《〈 反 余 弱 函数 ) 、atan《〈 反 正切 函数 ) 、asnh《〈 反 双 曲 
正弦 函数 ) 、acsh( 反 双 曲 余弦 函数 ) 、log( 求 原 数 为 2 的 对 数 )、 
lg( 求 底数 为 10 的 对 数 ) 、Im《〈 求 确 数 为 e 的 对 数 ) 、sqrt《〈 求 平方 

根 ) 、cbrt《〈 求 立方 根 ) 、recp( 求 倒数 ) 、rad 将 角度 值 转 为 弧 撤 
值 )、deg〔 将 弧度 制 转 为 角度 值 )、exp( 求 e 的 曙 ) 。 这 些 数学 函数 
都 只 含 一 个 参数 ， 并 且 需 要 使 用 括号 将 参数 包 里 起 来 ， 比 如 : 


calculattor log[4]+sqgrt[9]。 





4) 本 计算 圳 还 文 持 两 个 数学 常量 ， 一 个 是 e， 一 个 是 pi。 比 如 : 


calculator sin (pi) + cos (0) -eA2。 


5) 在 参数 字符 串 中 ， 所 有 字母 均 可 以 用 大 写 和 小 写 ， 解 析 程 序 的 
预 处 理 器 会 将 所 有 大 写字 母 转 换 为 小 写字 母 。 





下 面 ， 我 们 将 先 介绍 此 代码 中 的 一 些 关 键 思想 ， 然 后 给 出 完整 的 源 
代码 。 


21.1 对 数字 的 解析 





计算 器 中 的 算式 解析 过 程 中 最 重要 的 步骤 之 一 就 是 要 将 数字 、 操 作 
函数 名 等 元 素 解析 出 来 。 其 中 对 数字 的 解析 是 最 复杂 的 ， 因 此 我 们 
单独 通过 一 节 来 为 大 家 介绍 如 何 解析 算式 中 的 数字 。 


首先 ， 我 们 要 定义 好 在 算术 表达 式 中 哪些 数字 表达 是 合法 的 ， 哪 些 
是 不 合法 的 。 在 本 计算 器 程序 中 ， 这 些 都 是 合法 的 数字 : 10， 
20.5，.23，0。 而 这 些 不 是 合法 的 数字 : 36.52.34， 因 为 在 52 之 前 已 经 有 
了 一 个 小 数 点 ， 而 在 34 之 前 又 出 现 了 一 个 ， 此 时 解析 器 会 在 34 之 前 的 那 
个 小 数 点 处 停止 解析 ， 然 后 直接 返回 当前 状态 。 


有 了 上 述 合 法 数字 表达 的 定义 之 后 ， 我 们 就 可 以 依 此 构造 出 一 个 状 
态 机 了 ， 如 图 21-1 所 示 。 


图 21-1 中 ， 实 心 圆圈 表示 起 始 状 态 ; 实心 圆圈 外 和 面 再 加 一 圈 的 圈 较 
表示 终止 状态 ， 在 实际 程序 中 则 表示 当前 数字 解析 函数 的 返回 ， 直角 和 矩 
形 表示 一 个 动作 行为 ， 圆 角 窍 形 则 表示 当前 状态 ， 变形 表示 条 件 判 断 。 
由 于 数学 常量 也 表示 一 个 特定 的 数 ， 所 以 这 里 将 数学 第 量 与 一 般 的 数字 
放 在 一 起 解析 。 





21.2 ”对 操作 符 的 优先 级 处 理 


为 了 使 我 们 的 算术 表达 式 尽 可 能 与 数学 上 的 常用 表达 匹配 ， 我 们 区 
需要 对 计算 操作 符 做 运算 优先 级 的 处 理 。 在 本 计算 器 程序 中 安排 了 四 个 
优先 级 ， 以 下 按照 从 小 到 大 的 次 序 排 列 : 


1) +《〈 加 ) 、- ( 减 ): 加 法 与 减法 操作 符 的 优先 级 是 最 低 的 。 


2) *(〈 乘 ) 、/〈 除 ) 、% ( 求 模 ) : 这 些 运算 操作 的 优先 级 处 于 第 


二 等 级 。 
3) 人 (和顺 ) : 指数 计算 的 优先 级 处 于 第 三 等 级 。 


4) 括号 : 括号 的 运算 优先 级 是 最 高 的 。 这 里 要 说 明 的 是 ， 由 于 数 
学 阔 数 后 面 必须 跟 括 写 ， 所 以 函数 操作 的 优先 级 也 要 大 于 以 上 3 类 操作 
和 从 的 优先 级 。 















i 





已 包含 浮 点 不 包含 浮 点 
的 浮 点 数 的 整数 


潜入 一 个 字符 


是 否 为 0 到 9 











图 21-1 数字 解析 状态 机 


对 于 相同 优先 级 的 运算 操作 ， 在 同一 函数 调用 层 中 按照 从 左 到 右 的 
顺序 做 归 约 计算 ， 比 如 : 1+2-3， 其 计算 次 序 就 是 先 计 算 1+2 的 值 ， 然 后 
再 计算 3-3 的 值 。 


对 于 过 到 比 当 前 计算 优先 级 更 高 的 计算 操作 时 ， 本 计算 器 解析 程序 


将 采用 递归 方式 进行 计算 。 比 如 1+2* (3+4) ， 其 递归 调用 次 序 如 图 21- 
2 所 示 。 


-必用 CC 工 





第 二 层 调用 a 
第 三 层 调用 本 CC 


图 21-2 ”四 则 运算 的 递归 调用 逻辑 


图 21-2 中 展示 了 计算 式 1+2* (3+4) 的 递归 调用 次 序 。 首 先 ， 解 析 
器 遇 到 1+2 时 查看 后 面 那个 操作 符 的 优先 级 ， 由 于 乘法 优先 级 大 于 加 
法 ， 因 此 将 2* 操 作 作为 递归 调用 。 随 后 遇 到 《〈 符 号 ， 那 么 它 的 优先 级 比 
乘法 操作 高 ， 因 此 再 做 一 层 递 归 调 用 。 在 第 三 层 调 用 中 ， 将 3+4 的 结果 
计算 完 之 后 返回 到 第 二 层 调 用 ， 做 2*7 的 操作 ， 然 后 完成 该 计算 之 后 再 
返回 到 第 一 层 调用 ， 完 成 最 后 的 1+14 的 计算 ， 最 终 得 到 计算 结果 15。 


而 对 于 计算 表达 式 2+3*4+5，2+ 处 于 第 一 层 调 用 ， 而 后 面 的 3*4+5 
作为 第 二 层 调用 ， 由 于 加 法 计算 满足 结合 律 ， 所 以 在 这 种 情况 下 就 相当 
于 (2+3*4) +5=2+ (3*4+5) 。 这 里 的 一 个 副作用 是 减法 不 满足 结合 


律 ， 因 此 我 们 要 计算 减法 的 时 候 ， 实 际 上 要 将 减 号 的 右 操 作 数 做 取 相 反 
数 操 作 ， 然 后 将 减法 变 成 加 法 。 比 如 ， 我 们 要 计算 1-2*3-4， 我 们 就 要 将 
它 转 为 : 1+ (-2) *3+ (-4) 。 


21.3 ”代码 示例 


我 们 前 面 己 经 大 致 介绍 了 这 到 控制 合计 算 需 程序 。 下 面 我 们 就 要 开 
始 实现 此 控制 台 计 算 器 的 具体 代码 。 


首先 要 声明 的 是 ， 这 份 代码 示例 可 以 从 笔者 的 GitHub 上 获得 完整 的 
代码 资源 : https://github.com/zenny-chen/SimpleCalculator 





该 项 目 就 仅 由 一 个 main.c C 源 文件 构成 。 这 里 面包 含 了 main 函 数 以 
及 对 计算 表达 式 的 解析 和 相关 处 理 函 数 。 代 码 清单 21-1 展 示 了 main.c 中 
的 所 有 内 容 。 


代码 清单 21-1 ”main.c 源 代码 





#include <stdio.h> 
#include <string.h> 
#include <math.h> 
#include <stdlib.h> 
#include <stdbool.h> 
#include <stdint.h> 
#include <stdalign.h> 


/** 我 们 这 里 使 用 简约 的 var 作 为 对 象 类 型 的 自动 推导 */ 


#define var __auto_type 


/** 我 们 指定 输入 表达 式 的 最 大 长 度 为 2047 字 节 ， 超 出 部 分 将 被 截断 */ 
#define MAX_ARGUMENT_LENGTH 2047 


/** 用 于 标记 解析 符号 时 的 当前 状态 */ 
enum PARSE_PHASE_STATUS 
t 







































































PARSE_PHASE_STATUS_LEFT_OPERAND = 0， 
PARSE_PHASE_STATUS_RIGHT_OPERAND, 
PARSE_PHASE_STATUS_LEFT_PARENTHESIS, 
PARSE_PHASE_STATUS_NEED_OPERATOR = 4, 
PARSE_PHASE_STATUS_HAS_ NEG = 8 

















}; 
/xx 当前 算术 计算 优先 级 */ 





enum OPERATOR_PRIORITY 
{ 
/** 加 减法 优先 级 */ 
OPERATOR_PRIORITY_ADD, 


/xx 乘除 以 及 求 模 优先 级 */ 
OPERATOR_PRIORITY_MUL, 











/xx 过 运算 优先 级 */ 
OPERATOR_PRIORITY_POW 
}; 


/** 判定 当前 字符 是 否 属于 数字 */ 
static inline bool IsDigital(char ch) 


{ 


} 

A 

* @return 如 果 是 数学 常量 ， 则 返回 该 常量 的 字符 个 数 ， 否 则 返 
*/ 








return ch >= '0' && ch <= '9'， 





辑 














五 














0 














static inline int IsMathConstant(const char *cursor) 












































if(cursor[0] == 'p' && cursor[1] == 'i') 

return 2; 
// 由 于 本 程序 还 支持 exp 函 数 用 于 计算 e 的 指数 宕 ， 
// 所 以 如 果 后 面 e 后 面包 含 了 一 个 x， 那 么 这 个 e 就 不 会 是 数学 常量 
if(cursor[0] == 'e' && cursor[1] != 'x') 

return 1; 
return 0©; 


} 


/** 判定 当前 字符 是 否 可 能 为 函数 */ 
static inline bool IsMathFunction(char ch) 


{ 
} 


/** 对 数字 进行 解析 */ 
static double ParseDigital(const char *cursor, int *pRetLength) 


{ 
// 我 们 先 判断 当前 是 否 为 数学 常量 
var length = IsMathConstant(cursor); 
if(length > 0) 
{ 








return ch >= 'a' && ch <= 'Z 





























*pRetLength = length,; 
return (cursor[0] == 'p')? M PI : M_E; 
} 


char value[MAX ARGUMENT_LENGTH + 1]; 


char ch; 
var index = 0; 
var hasDot = false; 



































do 
{ 
ch = cursor[index]; 
if(ch == '.') 
// 如 果 之 前 已 经 出 现 了 小 数 点 ， 那 么 这 里 就 中 断 解析 
if(hasDot) 


break; 


else 
hasDot = true; 


value[index] = ch; 


} 
else if(!IsDigital(ch)) 
break; ”// 在 其 余 情 况 下 ， 倘 若 不 是 数字 ， 则 立即 中 断 解 析 








value[index++] = ch; 
we != '\0'); 
value[index] = '\0'; 
*pRetLength = index; 
// atof 函 数 是 将 一 人 i 点 数值 


// 该 函数 在 <std1ib . h> 头 文件 中 声明 
return atof(value); 





} 
static double Addop(double a, double b) 


return a + b; 


static double MinusOp(double a, double b) 
{ 


return a - b; 


static double MulOp(double a, double b) 


return a * b; 


} 
static double Divop(double a, double b) 


return a / b; 


} 
static double Modop(double a, double b) 


// 由 于 求 模 操作 时 ， 操 作 数 必须 是 整数 ， 
// 所 以 我 们 这 里 将 a 与 b 都 转换 为 带 符号 的 64 位 整数 类 型 
return (int64 t)a % (int64_t)b; 






































} 


/** 定义 了 一 个 操作 函数 表 ， 方 便 快速 定位 当前 操作 符 所 对 应 的 操作 函数 */ 
static double (* const opFuncTables[])(double, double) = { 
// 为 了 进一步 节省 全 局 存储 空间 ， 我 们 这 里 将 根据 ASCII 码 表 找 出 最 小 的 字符 值 ， 
// 将 该 值 作为 9， 后 续 的 都 减 去 该 值 。 通 过 ASCII 表 可 以 知道 ， 值 最 小 的 符号 是 % 
// 它 的 值 为 0x25。 然 后 我 们 可 以 用 指定 索引 的 初始 化 器 对 opFuncTab1les 进 行 初始 化 











































































































['%' - '%'] = &Modop， 
xx - '%'] = &MulOp, 
['+' - '%'] = &Addop, 
'-' - '%'] = &Minusop, 
['/' - '%'] = &Divop, 
['^'" - '%'] = &pow 


}; 


/** 判定 是 否 为 有 效 操作 符 */ 
static inline bool IsOperator(char ch) 




















return (ch >= '%' @& ch <= 1/') || ch == A; 


} 


static double radian(double degree) 


{ 
return degree * M PI / 180.0,; 
} 
static double degree(double radian) 
{ 
return radian * 180.0 / M_PI,; 
} 
static double cot(double radian) 
{ 
return tan(M PI * 0.5 - radian); 
} 
static double recp(double x) 
{ 
return 1.0 / x; 
} 
static const struct 
{ 


int name; 
double (*pFunc)(double); 

} mathFuncList[] = { 
'\QOnis', &sin }, 
'\QOsoc', &cos }, 
'\QOnat', &tan }, 
'\Otoc', &cot }, 
'hnis', &sinh }, 
'hsoc', &cosh }, 
'hnat', &tanh }, 
'nisa', &asin }, 
'soca', &acos }, 
'nata', &atan }, 
'hnsa', &asinh }, 
'hsca', &acosh }, 
'\0g0ol1', &1l0g2 }, 
'\0\0g1', &]l10g10 }, 
'\O\0Nn1', &l0og }, 
'trqs', &sqrt }, 
'trbc', cbrt }, 
'pcer', &recp }, 
'\QOdar', &radian }, 
'\Qged', &degree }, 
'\QOpxe', &exp } 
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}; 


static double (*ParseMathFunction(const char *cursor, int *pLength))(double) 


{ 




















// 这 里 buffer 至 少 要 求 4 字 节 对 齐 。 因 为 我 们 后 面 会 对 前 4 个 字 节 内 容 进 行 同时 访问 
char alignas(4) buffer[8] = { '\0'" }; 
var index = 0; 


// 由 于 这 里 规定 的 数学 符号 最 多 占用 4 个 字 节 ， 所 以 需要 用 一 个 计数 器 来 防止 访问 越界 
for(var count = ©; count < 4; count++， index++) 


{ 































































































var ch = cursor[index]; 

if(!IsMathFunction(ch)) 
break; 

buffer[index] = ch,; 


} 
buffer[index] = '\0'; 











// 同时 取出 刚才 所 存放 的 4 个 字 节 内 容 ， 方 便 比较 


var value = *(int*)buffer,; 


// 查找 函数 表 中 是 否 含 有 该 函数 名 
const var a = sizeof(mathFuncList) / sizeof(mathFuncList[0]); 
for(typeof(length + 0) i = 0; i < length; i++) 











if(mathFuncList[i].name == value) 


*pLength = index; 
return mathFuncList[i].pFunc; 


} 


return NULL; 
} 


A 

* 解析 当前 的 算术 表达 式 

* @param ppCursor 指向 当前 算术 表达 式 字 符 串 的 地 址 。 

它 既 是 输入 又 是 输出 。 当当 前 算术 表达 式 作为 括号 进行 计算 时 ， 
需要 将 右 括号 的 位 置 输出 到 实 
@param leftoperand 二 操作 数 的 人 
@param status 当前 计算 状态 
@param priority 当前 计算 的 算术 优先 级 
@param pStatus 输出 解析 状态 

* @return 输出 计算 表达 式 的 结果 

WA4 
static double ParseArithmeticExpression(const char **ppCursor, double 
leftOperand, enum PARSE_ PHASE_STATUS status, enum OPERATOR_PRIORITY 
priority, bool *pStatus) 
{ 














* 









































I 














,A 














const char *cursor ppCursor ; 


二 大 
var rightoperand 0.0; 
var length = 0; 


// 指向 操作 符 函 数 的 指针 
double (*pOpFunc)(double, double) = NULL; 


// 指向 数学 函数 的 指针 
double (*pMathFunc)(double) = NULL; 





Ly 

















bool isSuccessful = true,; 
char ch; 

do 

{ 


ch = *cursor; 

















// 先 判定 当前 字符 是 否 属于 数字 或 数学 常量 
if(IsDigital(ch) || IsMathConstant(cursor) > 0) 





ul 








double value = ParseDigital(cursor, &length); 
cursor += length,; 


if((status & PARSE PHASE_ STATUS_ RIGHT_OPERAND) == PARSE_PHASE_ 
STATUS_LEFT_OPERAND) 





Jeftoperand = value; 

// 如 果 具 有 负数 符号 ， 则 将 左 操作 数 做 取 相 反 数 操作 

if((status & PARSE_PHASE_STATUS_HAS_NEG) != 0) 
Jeftoperand = -Jeftoperand ; 



































else 


} 


// 1 





// 对 于 当前 为 右 操作 数 的 情况 ， 根 据 操作 符 计算 


























// 需要 进一步 判定 后 面 的 操作 优先 级 是 否 大 于 前 面 



































// 如 果 大 于 前 面 的 ， 则 需要 做 递归 计算 


rightoperand = Value 
































L 先 级 ， 


的 > 


// 如 果 具 有 负数 符号 ， 则 将 左 操作 数 做 取 相 反 数 操作 
if((status & PARSE_PHASE_STATUS_HAS_NEG) != 0) 














rightoperand = -rightOperand; 


清除 负数 标志 





status &= ~PARSE_PHASE_STATUS_HAS_NEG ， 


// 添加 后 续 需 要 算术 操作 符 的 状态 标志 














status |= PARSE_ PHASE_ STATUS_NEED OPERATOR; 


} 
else if(IsMathFunction(ch)) 


{ 


pMathFunc = ParseMathFunction(cursor, &length); 
if(pMathFunc == NULL) 


// 如 果 数 学 函数 返回 空 ， 说 明 解 析 失 败 ， 立 即 中 断 解 析 











isSuccessful = false; 


break; 
} 
cursor += length,; 
if(*cursor != '(') 


} 























// 如 果 函 数 后 面 没有 跟 (， 那 也 不 是 一 个 合法 的 表达 式 ， 立 即 


isSuccessful = false; 
break; 


} 
else if(IsOperator(ch)) 


{ 














// 这 个 区 间 范 围 内 包含 了 常用 的 算术 操作 符 以 及 左右 圆 括号 ， 


// 因此 我 们 在 这 个 分 支 中 同时 对 这 两 类 符号 进行 解析 判断 





















































if(ch == '(') 


Cursor++， 





FP 断 解析 


double value = ParseArithmeticExpression(&cursor, 0.0, 
PARSE_PHASE_STATUS_LEFT_OPERAND | PARSE_PHASE_STATUS_LEFT 





PARENTHESIS, OPERATOR_PRIORITY_ADD, &isSuccessful); 





// 如 果 当 前 游标 所 指向 的 字符 不 是 ' )'， 说 明 没有 
if(!isSuccessful || *cursor != ')') 
{ 


isSuccessful = false; 
break; 


} 








匹配 到 合适 的 )， 





中 断 解 析 


if((status & PARSE_PHASE_STATUS_RIGHT_OPERAND) == 0) 





{ 





// 如 果 当 前 状态 为 左 操作 数 
if(pMathFunc != NULL) 
{ 





Jeftoperand = pMathFunc(value); 


pMathFunc = NULL; 


else 
Jeftoperand = value,; 








} 
else 
22 DG 
// 如 果 当 前 状态 为 右 操作 数 
if(pMathFunc != NULL) 
{ 
rightoperand = pMathFunc(value); 
pMathFunc = NULL; 
} 
else 
rightoperand = value; 
} 





// 清除 当前 左 括号 状态 
status &= ~PARSE_PHASE_STATUS_LEFT_PARENTHESIS ; 














// 添加 后 续 需 要 算术 操作 符 的 状态 标志 
status |= PARSE_PHASE_STATUS_NEED_OPERATOR 





} 
else if(ch == ')') 
{ 











// 将 当前 游标 位 置 输出 给 实 参 
*ppCursor = cursor; 




















return (pOpFunc != NULL)? pOpFunc(leftOperand, rightOperand) 





Jeftoperand ; 
} 
else 
{ 
if((status & PARSE_PHASE_STATUS_NEED_OPERATOR) == 0) 
if(ch == '-') 
{ 


// 如 果 当 前 不 需要 操作 符 ， 则 将 减 号 视 作 负数 符号 

// 作为 负数 符号 的 话 ， 后 面 必须 跟 一 个 数 ， 否 则 也 是 无 效 的 

if(IsDigital(cursor[1]) || IsMathConstant(&cursor[1]) > 0) 
status |= PARSE_PHASE_STATUS_HAS_NEG,; 












































else 
{ 
isSuccessful] = false; 
break; 
} 
} 
else 
{ 
// 对 于 其 他 情况 ， 如 果 当 前 状态 不 需要 操作 符 ， 那 么 表达 式 非法 ， 
// 立即 中 断 解析 
isSuccessful = false; 
break; 
} 
} 
else 
{ 
var tmpFunc = opFuncTables[ch - '%']; 


if(tmpFunc == NULL) 


// 如 果 没 找到 对 应 的 操纵 符 函 数 ， 说 明 当 前 输入 字符 是 非法 的 ， 
// 直接 中 断 解析 


isSuccessful = false; 



































break; 

} 

// 判定 当前 操作 符 的 计算 优先 级 

var pry = OPERATOR_PRIORITY_ADD ; 

if(tmpFunc == Modop || tmpFunc == MulOp || tmpFunc == DivOp) 
pry = OPERATOR_PRIORITY_MUL 

else if(tmpFunc == pow) 
pry = OPERATOR_PRIORITY_POW; 











if(pOpFunc == NULL) 
popFunc = tmpFunc; 


if((status & PARSE PHASE_ STATUS_ RIGHT_OPERAND) == 0) 








// 当前 操作 符 解析 成 功 ， 后 续 将 需要 该 操作 的 右 操作 数 
status |= PARSE_PHASE_STATUS_RIGHT_OPERAND; 











} 


else 


// 如 果 之 前 优先 级 不 小 于 当前 操作 符 的 优先 级 ， 那 么 立即 做 归 约 
if(priority >= pry) 
{ 








Jeftoperand = pOpFunc(leftOperand, rightOoperand); 
rightoperand = 0.0; 

// 随后 更 新 当前 操作 函数 以 及 计算 优先 级 

poOpFunc = tmpFunc; 









































































































































































































































































































































} 
else 
{ 
// 如 果 当 前 碰 到 了 比 之 前 优先 级 更 改 的 操作 符 ， 
// 那么 我 们 采用 递归 的 方式 进行 计算 
if(pOpFunc == MinusOp) 
// 如 果 之 前 的 计算 是 减法 ， 那 么 根据 减法 不 适用 于 结合 律 的 
// 性 质 ， 我 们 这 里 将 它 作 为 一 个 加 法 ， 并 且 将 右 操作 数 取 负 
popFunc = Addop ; 
rightoperand = -rightoperand ; 
} 
else if(pOpFunc == DivOp) 
{ 
// 如 果 之 前 的 计算 是 除法 ， 那 么 根据 除法 不 适用 于 结合 律 的 
// 性 质 ， 我 们 这 里 将 它 作为 一 个 乘法 ， 将 右 操作 数 取 其 倒数 
pOpFunc = Mu10p 
rightoperand = 1.0 / rightoperand 
} 
// 递归 做 高 优先 级 的 运算 操作 
var value = ParseArithmeticExpression(&cursor, 
rightoperand，PARSE_PHASE_STATUS_LEFT_OPERAND | 
PARSE_PHASE_STATUS_NEED_OPERATOR, pry, pStatus); 
// 由 于 我 们 可 能 会 碰 到 在 括号 操作 符 中 的 高 优先 级 运算 的 归 约 
// 比如 考虑 这 个 表达 式 : (1+2*3) 
// 这 里 ，2*3) 会 在 同一 个 调用 级 中 ， 所 以 ) 的 输出 无 法 影响 到 
// 先前 的 (， 所 以 这 里 我 们 也 要 将 当前 游标 位 置 进行 输出 ， 
// 返回 给 上 一 级 的 调用 
*ppCursor = cursor 
return pOpFunc(leftOperand, value); 
} 





} 
// 更 新 当前 计算 优先 级 





priority = pry; 





// 清除 需要 操作 符 标志 
status &= ~PARSE_PHASE_STATUS_NEED_OPERATOR 




































































} 
// 对 于 所 有 操作 符 情 况 ， 最 后 都 让 游标 往 前 走 一 格 
CUrSoOr++' 
} 
else 
// 如 果 遇 到 其 他 字符 ， 倘 若 不 是 字符 串 结束 符 则 宣告 解析 失败 
if(ch != '\0') 
{ 
isSuccessful = false; 
break; 
} 
} 
} 
while(ch != '\0'); 





// 若 解 析 失 败 ， 则 后 续 出 结果 时 不 做 任何 相关 计算 
if(!isSuccessful) 
popFunc = NULL; 





if(pStatus != NULL) 
*pStatus = isSuccessful; 


return (pOpFunc == NULL)? leftOperand : pOpFunc(leftOperand, rightOperand); 
} 


A 

* 计算 输入 的 算术 表达 式 

* @param expr 输入 的 算术 表达 式 字符 串 国 

* @param result 以 字符 串 的 形式 输出 结果 ， 这 里 设置 了 实 参 至 少 需要 提供 的 缓存 长 度 

* @return 如 果 表 达 式 解析 成 功 ， 返 回 true， 否 则 返回 false 

* 

/ 

bool CalculateArithmeticExpression(char expr[], char result[static 32]) 






















































































If(expr[0] == '\0') 
return false; 








/xx* 我 们 先 对 输入 字符 串 做 一 些 过 滤 ， 使 得 当中 出 
var length = (int)strlen(expr); 








见 的 一 些 符 号 能 适 配 本 程序 */ 
























































// 由 于 一 些 命令 控制 台 不 支持 带 有 圆 括号 ( ) 的 表达 式 ， 但 支持 方 括号 [] 表 达 式 ， 
// 所 以 我 们 这 里 可 以 将 输入 中 的 [] 再 蔡 换 回 ( ) 。 
// 此 外 ， 我 们 将 出 现 的 所 有 大 写字 母 蔡 换 为 小 写字 母 


for(var i = 0; i < length; i++) 






































{ 

var ch = expr[i]; 

if(ch == '[') 
expr[i] = "('; 

else if(ch == ']') 
expr[i] = ')'; 

else if(ch == '$') 
expr[i] = '^'; 


else if(ch >= 'A' && ch <= 'Z') 








// 由 于 ASCII 人 码 的 巧妙 设计 ， 大 写字 母 与 小 写字 母 正 好 相差 Ox20， 
// 所 以 我 们 这 里 只 需 通 过 加 上 0x29 值 就 能 方便 地 将 大 写字 母 转 为 小 写字 母 









































int 


expr[i] += Ox20; 
} 
bool ret = false; 


var value = ParseArithmeticExpression((const char**)&expr, 0.0, 
PARSE_PHASE_STATUS_LEFT_OPERAND, OPERATOR_ PRIORITY_ADD, &ret); 





if(!ret) 
return ret; 











// 我 们 将 结果 显示 为 小 数 点 后 面 跟 8 位 尾数 
sprintf(result, "%.8f", value); 























// 我 们 下 面 将 把 多 余 的 .09909600 这 种 字样 给 过 滤 掉 ， 使 得 结果 输出 更 好 看 一 些 
length = (int)strlen(result); 

var dotIndex = -1; 

var hasE = false,; 

for(var i = 0; i < length; i++) 














{ 
if(result[i] == '.') 
dotIndex = 工 ; 
else if(result[i] == 'e') 


hasE = true; 














} 
// 我 们 只 有 在 仅 存在 小 数 点 的 情况 下 做 过 渡 
if(dotIndex >= 0 && !hasE) 









































{ 
var index = length,; 
while(--index > 0) 
{ 
if(result[index] != '0') 
break; 
result[index] = '\0',; 
} 
// 如 果 dotIndex 后 面 没有 具体 数字 了 ， 那 么 我 们 将 小 数 点 也 过 滤 掉 
if(result[dotIindex + 1] == '\0') 
result[dotIindex] = '\0'; 
} 


return true; 


main(int argc, const char * argv[]) 

















// argc 用 于 存放 参数 个 数 。 在 Windows 以 及 各 类 Unix 系 统 中 ， 参 数 以 空格 符 进行 分 隔 。 
// 因此 我 们 在 使 用 该 程序 时 ， 计 算 表 达 式 中 不 应 该 含有 空格 符 〈 包 括 空 格 和 制 表 符 ) 。 
// 假定 我 们 生成 的 可 执行 程序 名 为 SimpleCcalculator， 那 么 在 控制 台 输 入 ; 

// Simplecalculator 1+2 是 合法 的 。 
// 而 输入 : Simplecalculator 1 + 2， 则 直接 输出 结果 1， 后 面 的 +2 会 被 忽略 
if(argc < 2) 



















































































puts("No expression to calculatel")， 
return 0; 


} 


var length = strlen(argv[1]); 


if(length == 0) 
{ 


puts("No expression to calculate!"),; 
return ©; 


} 


// 对 参数 表达 式 长 度 做 截断 ， 取 由 宏 指 定 的 长 度 
if(length > MAX_ARGUMENT_LENGTH) 
length = MAX_ARGUMENT_LENGTH; 


// 我 们 准备 一 个 字符 串 缓存 ， 将 通过 程序 参数 传递 进来 的 字符 串 表达 式 拷贝 到 当前 程序 的 栈 上 ， 
// 便于 后 续 解 析 操 作 
char argBuffer[MAX_ARGUMENT_LENGTH + 1]; 










































































// 我 们 这 里 使 用 strncpy 也 使 得 在 做 字符 串 拷 贝 的 时 候 确保 长 度 不 超过 指定 的 length 大 小 。 
// 这 里 之 所 以 使 用 strncpy 而 不 是 memcpy， 

// 是 因为 strncpy 会 在 目标 缓存 最 后 添加 一 个 字符 串 结 束 符 '\0'。 

// 该 函数 在 <string .h> 头 文件 中 

strncpy(argBuffer, argv[1], length); 
















































































char result[32]; 
var state = CalculateArithmeticExpression(argBuffer, result); 
printf("The arithmetic expression to be calculated: %s\n", argBuffer); 
if(state) 

printf("The answer is: %s\n", result); 


else 
puts("Invalid expression!"); 





代码 清单 21-1 中 的 代码 必须 在 GCC 4.9 或 更 高 版 本 、Clang 3.8 或 更 
高 版 本 ， 以 及 Apple LLVM 8.0 或 更 高 版 本 上 才能 通过 编译 构建 。 此 外 ， 
编译 选项 中 必须 加 入 -std=gnul1。 





21.4 ”本 章 小 结 


本 章 给 大 家 介绍 了 如 何 使 用 C 语 言 制作 一 个 基于 控制 台 的 计算 器 。 











位 管 这 个 功能 看 上 去 不 算 复业 ， 但 实际 实现 起 来 还 是 有 一 定 的 复杂 度 。 
本 程序 中 ， 笔 者 通过 递归 来 解决 算术 表达 式 的 计算 优先 级 问题 ， 通 过 使 
用 有 限 状 态 机 来 逐 字 节 地 解析 当前 输入 符号 ， 将 它 归 类 。 在 一 开始 先 建 
并 了 一 个 状态 图 ， 这 有 助 于 对 此 程序 的 理解 。 








我 们 可 以 在 Windows 以 及 其 他 类 Unix 系 统 中 编译 这 段 代码 然后 运 
行 。 当 然 对 编译 器 的 要 求 是 GCC 4.9 或 更 高 版 本 、Clang 3.8 或 更 高 版 
本 。 如 果 各 位 在 Windows 系 统 上 的 话 ， 可 以 使 用 MS-Clang Mingw 编 译 器 
进行 编译 构建 。 


